Manon BERNARD, Marie-Amélie BOTALLA et Célia DEBRAY vous souhaitent la bienvenue.
Créé lors du cours de "BAO", ce site nous permet de vous donner un aperçu du travail accompli en Master 1 Ingénierie Linguistique, en vous décrivant les différentes étapes réalisées ainsi que les résultats obtenus.



Ce projet BAO (Boîte à Outil) a pour objectif le traitement des fils RSS du journal Le Monde récupérés tout au long de l'année 2012. Cependant, faire tourner le programme sur une telle quantité de données se révêle être extrêmement long. Nous l'avons donc testé sur les données des quinze premiers jours du mois de janvier 2008. Le programme en question extrait le contenu des fils RSS et permet son étiquettage. D'autres programmes vont ensuite permettre l'extraction de patrons à partir des étiquettes obtenues, puis la présentation des données sous forme de nuages.Les scripts ont été écrits en Perl et appellent d'autres programmes tels que Cordial et Treetagger.


Lien vers Treetagger

Lien vers le site PluriTal