Ce site est réalisé dans le cadre du cours de "Projet encadré et programmation" semestre 2 du Master 1 Ingénierie Linguistique à Paris 3. Nous vous présentons le projet Boîte à Outils mené sur le corpus de fils RSS du journal Le Monde collecté en 2012.
Pour voir tous les outils utilisés et le détail des tâches effectuées pour mener à bien notre projet,cliquez sur nos boîtes.
Pour ce projet, 4 tâches on été éffectuées. Chaque tâche étant assimilées à une boite à outils. Nous avons donc, successivement :
- - Récupéré pour chaque rubrique de notre corpus, le titre et la description des fils de deux façons différentes :
- -> en utilisant un script perl
- -> en utilisant un module XML::RSS
- - Etiqueté simultanément les données générées avec Coridal et Treetagger.
- - Extrait des patrons, à partir des sorties Cordial et Treetagger.
- - Représenté ces patrons sous forme de graphes en utilisant le Trameur.
QUI SOMMES-NOUS ?
Nous sommes trois étudiantes en première année de Master Ingénierie Linguistique : Dalila Rome (Paris 10), Mélissa Duclos (Paris 3) et Asceline Goudjo (Paris 3).
Dans notre site, nous présentons les différentes étapes du projet de programmation intitulé "Boîte à Outils".