Nous avons réalisé ce projet pendant notre deuxième semestre de Master 1 TAL au fil du cours de "Programmation et Projet Encadré 2". Il se décompose en 4 parties, ou boites à outils, chacune applicant un traitement supplémentaire à la précédente, formant une sorte de "pipeline"
Cette pipeline permettra, à partir du répertoire de flux RSS du journal Le Monde pour l'année 2016 de récupérer les titres et descriptions de chaque article paru dans une rubrique donnée (Sport dans notre cas), puis de les étiqueter morphosyntaxiquement grâce aux logiciels Cordial et TreeTagger afin d'en extraire les éléments correspondants aux patrons morphosyntaxiques choisis. Enfin, grâce au fichier patron2graphe.exe, nous rendrons les résultats obtenus visualisables sous forme de graphes.