Programmation et Projet encadré 2
Le projet consiste à utiliser le langage de programmation Perl pour exploiter un corpus de fils RSS du journal Le Monde. Il se divise en 4 grandes étapes (4 boîtes à outils) :
- Boîte à outils 1 : extraire le texte des fils rss.
- Boîte à outils 2 : étiqueter le texte extrait.
- Boîte à outil 3 : extraire des patrons morphosyntaxiques dans les fichiers annotés.
- Boîte à outil 4 : faire des représentations graphiques des patrons extraits.