Projet encadré 2
BOITES A OUTILS

OBJECTIF DU PROJET

BAO 1

Extraction du texte dans une arborescence de fils RSS du journal Le Monde. Les fils ont été reccueillis une fois par jour pendant un an en 2021.

BAO 2

Etiquetage du texte en morphosyntaxe avec TreeTagger et UDpipe.

BAO 3

Extraction de patrons morphosyntaxiques et de relations de dépendance avec Perl, Python, XSLT et XQuery.

BAO 1

Représentation des résultats sous forme de graphiques avec PadaGraph.

OUTILS

NOTE : Tous les scripts téléchargeables sont commentés.