Title:
Recherche et production de corpus de messages pour la multilinguisation
de sites de e-commerce en SMS, initialement en arabe
Abstract: Dans ce papier, nous présentons notre recherche
qui se déroule dans le cadre du projet CATS (Classified Ads through
SMS). CATS est une plate-forme d’achat et de vente d’automobile fondée
sur la communication de SMS en arabe qui fonctionne en Jordanie. Afin de
faire évoluer ce système en largeur en l’adaptant à
d’autres langues (français, anglais) et en longueur en l’appliquant
à d’autres secteurs (emploi, mariage, fourniture, appareils ménagers,
commerce de téléphone portable, pages jaunes…), nous sommes
dans la difficulté de trouver des corpus de SMS fonctionnellement
équivalents à un corpus arabe, réel et naturel. Une
simple traduction de ce corpus de départ donne-elle un corpus de même
critère (réel, naturel) ? Nous présentons, dans ce papier,
une réponse à cette question ainsi qu’une solution pour un
cas de multilinguisation de sites de e-commerce en SMS, initialement en arabe. In this paper, we present our research on the framework of CATS project
(Classified Ads through SMS). CATS is a platform of buy and sale of car based
on the Arabic SMS communication who functions in Jordan. In order to evolve
this system in width by adapting it to other languages (French, English)
and in length by applying it to other sectors (employment, marriage, domestic
machines, trade of mobile phone, pages yellow...), we are in the difficulty
in finding SMS corpora functionally equivalent to a real, arab and natural
corpus. A simple translation of this starting corpus gives it the same type
of corpus (real, natural)? We present, in this paper, an answer to this question
and a solution for a case of multilinguisation of sites of E-trade in SMS,
initially in Arabic.
Author: Najeh Hajlaoui