Projet Master TAL - Audrey GOMBAULT et Sara BOUHMADOU

Introduction..

Ce site est l'aboutissement de notre projet final du cours "Programmation et projet encadré 1" du Master 1 d'Ingénierie linguistique (Traitement Automatique des langues) de Paris 10,Paris 3 et INALCO.". Celui-ci a pour but de mettre en oeuvre une chaîne de traitement textuel semi-automatique depuis la récupération des données jusqu'à leur présentation.

Il s'agit de choisir un mot , de l'extraire ainsi que le contexte dans lequel il apparaît puis chercher les différentes occurrences de ce mot.

Le projet dans sa globalité comporte plusieurs étapes : un script, une analyse de co-occurrences.

Le corpus est multilingue. Il contient des données en Français traitées par Audrey GOMBAULT ainsi que des données en Arabe traitées par Sara BOUHMADOU.On a choisi de travailler autour du mot "pain" en français et en arabe. C'est un thème qui nous parle parce que le pain est l'aliment communs à plusieurs cultures. Comme il peut-être connotée de façon différente. Il est associée à la nourriture, à l'argent ou encore à la religion.

Le site contient notre travail accompli tout au long de semestre, depuis le choix du mot jusqu'à la génération de tableaux qui résume les données collectées. Les onglets du site vous permettent de découvrir notre parcours de travail, les résultats obtenus, ainsi que les problèmes rencontrés lors du parcours !