Valet Free HTML5 Template

BOITES A OUTIL 2 : PERL

Annotation du contenu textuel. On utiliser TreeTagger sur les fichiers .xml et Udpipe sur les fichiers .txt

I/ Présentation du script

Nous réutilisons les scripts de la BaO1 (explication ici) en les modifiant. En effet, on va ajouter quelques fonctions pour annoter les contenus textuels. Je présenterai seulement les fonctions ajoutées aux scripts. Il faut télécharger les scripts pour les avoir. Ce script va nous permettre d'annoter nos fichiers .xml avec TreeTagger et nos fichiers .txt avec Udpipe. Nous allons récupérer en sortie des fichiers .xml annotés par TreeTagger et des fichiers .txt annotés par Udpipe (puis convertis au format .xml). Le script est lancé depuis le répertoire PROJET-ENCADRE.

pour télécharger le script :

Temps : real 20m3.897s

II/ Résultats

Rubrique Sortie Udpipe (CoNNL) Sortie Udpipe (xml) Sortie TreeTagger (xml)
France resultat-france.udpipe resultat-france.xml resultat-france.xml
Europe resultat-europe.udpipe resultat-europe.udpipe.xml resultat-europe.xml
International resultat-international.udpipe resultat-international.udpipe.xml resultat-international.xml