Bievenue sur mon site web
Programmation et projet encadré 2
Ce projet de semestre 2 est réalisé dans le cadre du Master TAL. L'objectif est de mettre en oeuvre une chaîne de traitement semi-automatique avec Perl depuis la collecte des données d'un corpus de fils RSS provenant du journal Le Monde de l'année 2016, en passant par l'extraction des données aux formats XML et TXT, puis l'étiquetage avec deux outils Cordial et Treetagger, ensuite l'extraction des patrons morpho-syntaxiques et enfin une représentation graphique pour illustrer les différents patrons extraits.