Le script perl:

Dans la continuité de la BAO 1, permet deux annotations différentes de la rubrique du corpus choisie. On obtient deux sorties: l'une en txt et l'autre en xml.

BAO_2.pl

Pour lancer le script: perl BAO_2_Regex.pl nom_du_répertoire nom_de_la_rubrique


Fichiers obtenus:

2018:

Talismane (Texte Brut): sortie-sport-talismane-2018.txt

Treetagger (XML): sortie-sport-2018.xml

2017:

Talismane (Texte Brut): sortie-sport-talismane-2017.txt