Accueil BAO1 BAO2 BAO3 BAO4

Boite à Outils 2

La deuxième étape du projet consiste à annoter les informations textuelles que nous avons extraites.
La boîte à outils 2 propose deux solutions différentes pour l'étiquetage morphosyntaxique : TreeTagger et Talismane.
Ici, un seul script permet de réunir ces deux opérations.
Le temps de traitement est très long : plus de trois heures ont été nécessaires pour chaque rubrique.
Deux fichiers sont générés par rubrique à cette étape : un fichier xml contenant l'annotation de TreeTagger structurée, et un fichier texte avec l'étiquetage de Talismane.
Les résultats sont volumineux, ils ont donc été compressés. Ils sont à télécharger ici :

SCRIPT
RESULTATS