Algerie Europe coopération durable

Algerie Europe coopération durable
Patrick le Berrigaud

lundi 7 mai 2012

Wordnet Arabic bases de données Algerie Oran 2012


Des bases de données pour développer le Wordnet Arabic
ORAN- La création de bases de données linguistiques à des fins de traitement automatique de la langue arabe constitue l’une des principales recommandations émises par les participants à la 5ème édition du colloque international de traductologie, clôturé lundi après deux journées de conférences-débats à l’Université d’Oran.
Cette proposition, a-t-on indiqué, a pour objectif la mise en place d’une plateforme pour intégrer et développer la place de la langue arabe dans les autoroutes de l’information actuels, à savoir le Wordnet Arabic (Portail Web Arabe).
Les chercheurs ayant pris part à cette rencontre scientifique ont également plaidé pour la mise en place d’une veille technologique sur le traitement automatique de la langue arabe "afin d’assurer le suivi de toute avancée dans ce domaine".
Ils ont en outre préconisé la diversification des approches analytiques de la langue arabe aux plans linguistique, informatique et didactique, ainsi que la conceptualisation de prototypes de segmentation de la langue arabe.
L’accent a été mis aussi sur la sensibilisation de la communauté des chercheurs et du secteur économique quant à l’importance du développement des technologies liées aux ressources linguistiques et logicielles.
La valorisation des travaux de recherche, tels ceux portant sur l’élaboration de dictionnaires en ligne et de traducteurs automatiques pour la langue arabe dans différents registres lexicaux (tourisme, hydrocarbures, droit...), figure également parmi les grandes recommandations sanctionnant ce colloque.
Le président de cette manifestation scientifique, M. Farouk Bouhadiba, a insisté, dans ce contexte, sur le renforcement de la pluridisciplinarité dans la recherche en traitement automatique de la langue arabe et son transfert vers d’autres langues telles que le français, l’anglais, l’espagnol, le chinois et autres langues.
En termes généraux, le WordNet se résume à une base de données lexicales (initialement élaborée pour la langue anglaise) qui distingue entre les noms, les verbes, les adjectifs et les adverbes, et ce, en raison du fait que ces éléments de la langue sont régis par des règles grammaticales.
"Dans l’élaboration d’un WordNet, les noms et les verbes par exemple, sont organisés de façon hiérarchisée et sont généralement inventoriés sous forme architecturale, facilitant ainsi la tâche des linguistes dans la représentation des structures sémantiques de la langue aux mathématiciens et informaticiens qui en font des algorithmes sur la base des contraintes morphologiques et syntaxiques de la langue", a expliqué M. Bouhadiba.
Une soixantaine de chercheurs, issus de différentes universités algériennes et étrangères, ont participé à ce colloque organisé par le Laboratoire de recherche en linguistique, dynamique du langage et didactique de l’université d’Oran en collaboration avec le Centre de recherche en linguistique et TAL "Lucien Tesnière" de l’Université de Franche-Comté (Besançon, France).APS

Aucun commentaire:

Enregistrer un commentaire