BàO2 a l'objectif de faire une étiquetage du texte.
On extraite les contenus textuels bien étiquetés dans la façon automatique avec TreeTagger ou/et Talismane.
Avec le résultat de BàO1, on continue d'étiqueter du texte. On se réalise l'objectif grâce au script (on peut le trouver dans cette page).
Une fois qu'on a bien lancé le script de perl, on va avoir les différents types de résultats. Les resultats :
1. Talismane en format .txt
2. Treetagger en format .xml
3. Texte normale en format .txt