Projet encadré 2
BOITES A OUTILS
Accueil
BAO 1
BAO 2
BAO 3
BAO 4
Accueil
BAO 1
BAO 2
BAO 3
BAO 4
PROJET ENCADRE 2
-
BOITES A OUTILS
Mise en oeuvre d'une chaîne de traitement textuel semi-automatique, depuis la récupération des données jusqu'à leur présentation.
OBJECTIF DU PROJET
BAO 1
Extraction du texte dans une arborescence de fils RSS du journal
Le Monde.
Les fils ont été reccueillis
une fois par jour pendant un an en 2021.
BAO 2
Etiquetage du texte en morphosyntaxe avec TreeTagger et UDpipe.
BAO 3
Extraction de patrons morphosyntaxiques et de relations de dépendance avec Perl, Python, XSLT et XQuery.
BAO 1
Représentation des résultats sous forme de graphiques avec PadaGraph.
OUTILS
NOTE : Tous les scripts téléchargeables sont
commentés
.
Website Templates
created with
Website Builder Software
.