Title: Recherche et production de corpus de messages pour la multilinguisation de sites de e-commerce en SMS, initialement en arabe

Abstract
: Dans ce papier, nous présentons notre recherche qui se déroule dans le cadre du projet CATS (Classified Ads through SMS). CATS est une plate-forme d’achat et de vente d’automobile fondée sur la communication de SMS en arabe qui fonctionne en Jordanie. Afin de faire évoluer ce système en largeur en l’adaptant à d’autres langues (français, anglais) et en longueur en l’appliquant à d’autres secteurs (emploi, mariage, fourniture, appareils ménagers, commerce de téléphone portable, pages jaunes…), nous sommes dans la difficulté de trouver des corpus de SMS fonctionnellement équivalents à un corpus arabe, réel et naturel. Une
simple traduction de ce corpus de départ donne-elle un corpus de même critère (réel, naturel) ? Nous présentons, dans ce papier, une réponse à cette question ainsi qu’une solution pour un cas de multilinguisation de sites de e-commerce en SMS, initialement en arabe.

In this paper, we present our research on the framework of CATS project (Classified Ads through SMS). CATS is a platform of buy and sale of car based on the Arabic SMS communication who functions in Jordan. In order to evolve this system in width by adapting it to other languages (French, English) and in length by applying it to other sectors (employment, marriage, domestic machines, trade of mobile phone, pages yellow...), we are in the difficulty in finding SMS corpora functionally equivalent to a real, arab and natural corpus. A simple translation of this starting corpus gives it the same type of corpus (real, natural)? We present, in this paper, an answer to this question and a solution for a case of multilinguisation of sites of E-trade in SMS, initially in Arabic.

Author
: Najeh Hajlaoui

Back


6th IBIMA Conference   www.ibima.org