Bienvenue sur notre site !


Ce site a été réalisé dans le cadre du cours "Programmation et projet encadré" du second semestre du Master Traitement Automatique des Langues (INALCO - Paris 3 - Paris 10). Nous y présenterons les résultats des travaux que nous avons mené durant tout le semestre.


L'objectif de cours est de nous apprendre à programmer des "boîtes à outils" en Perl, chacune ayant une fonction différente que nous allons détailler au fur et à mesure. Pour cela, nous nous sommes appuyés sur les flux RSS du journal Le Monde, récoltés tous les jours à 19h, sur toutes les rubriques, par un programme mis en oeuvre par Serge Fleury.


La boîte à outils 1 a pour but l'extraction et le classement en rubriques du contenu textuel des fils RSS.

La boîte à outils 2 procède à l'annotation morphosyntaxique de ce contenu avec Cordial et TreeTagger.

La boîte à outils 3 va nous permettre d'extraire des patrons morpho-syntaxiques à partir des sorties de la BàO 2

La boîte à outils 4 est consacrée à la représentation de ces patrons sous forme de graphes avec l'outil patron2graphe.exe.

Pour les BàO 1, 2 et 3, nous présenterons au moins 2 solutions.


Nous tenons à remercier MM. Serge Fleury, Jean-Michel Daube et Rachid Belmouhoub pour leur gentillesse et leur disponibilité. Bonne visite !