Boite à outil Projet encadré 2

Boite à outil 2

Étiquetage du contenu textuel

Cette boîte sert à étiqueter automatiquement les contenus textuels extraits par BàO1 avec Treetagger et UDpipe pour de l’annotation en morpho-syntaxe et en dépendances.

Code perl
Code python

BàO2 en version Python fait appel à une fonction dans un autre script pythons.

Résultats

UPpipe

aperçu du fichier udpipe
Perl
Python

XML

aperçu du fichier xml
Perl
Python

L'analyse morpho-syntaxique est effectué pour Perl avec TreeTagger et Python avec UDpipe. On remarque que les étiquettes employées ne sont pas les mêmes entre ces deux outils. Non seulement la qualité d'étiquetage mais aussi cette différence doivent être prises en compte lors de traitements de données. Il faut choisir un outil en fonction de besoins.


Fichier résultat : udpipe (perl)

Fichier résultat : xml (perl)

Fichier résultat : udpipe.text (python)

Fichier résultat : xml (python)