Bienvenue!


Ce site est l'aboutissement du travail effectué dans le cadre du cours « Programmation et Projet Encadré 2 » du Master 1 Ingénierie Linguistique à la Sorbonne Nouvelle.

Ici vous trouverez mes travaux réalisés sur l'ensemble des fils RSS de l'année 2013 du journal Le Monde. Le travail est principalement réalisé avec Perl.


La Boîte à Outils est une série de traitements d'un corpus de fils RSS :

La BAO 1 est l'extraction des informations contenues dans les fils et leurs répartition en rubriques.

La BAO 2 est l'étiquetage de ces informations, par une modification de la BAO 1 via TreeTagger et Cordial.

La BAO 3 est l'extraction de motifs syntaxiques à partir des sorties de la BAO 2.

La BAO 4 est la visualisation et filtrage de ces motifs via le programme patron2graphe.exe.

L'onglet Website vous redirigera vers le website du journal "Le Monde".


Je vous souhaite une agréable visite!