Bienvenue!
Ce site est l'aboutissement du travail effectué dans le cadre du cours « Programmation et Projet Encadré 2 » du Master 1 Ingénierie Linguistique à la Sorbonne Nouvelle.
Ici vous trouverez mes travaux réalisés sur l'ensemble des fils RSS de l'année 2013 du journal Le Monde. Le travail est principalement réalisé avec Perl.
La Boîte à Outils est une série de traitements d'un corpus de fils RSS :
La BAO 1 est l'extraction des informations contenues dans les fils et leurs répartition en rubriques.
La BAO 2 est l'étiquetage de ces informations, par une modification de la BAO 1 via TreeTagger et Cordial.
La BAO 3 est l'extraction de motifs syntaxiques à partir des sorties de la BAO 2.
La BAO 4 est la visualisation et filtrage de ces motifs via le programme patron2graphe.exe.
L'onglet Website vous redirigera vers le website du journal "Le Monde".
Je vous souhaite une agréable visite!