2.XPATH - XSLT
Explication de la méthode
On a définit 4 feuilles de styles pour nos 4 patrons morphosyntaxiques: NOM-ADJ, ADJ-NOM, VERBE-DET-NOM, NOM-PREP-NOM-PREP. Ensuite, on les a appliqués sur les fichiers XML, les fichiers étiquetés par TreeTagger de BàO2. Pour extraire les résultats en format TXT, on a utilisé la commande XSLTPROC: XSLTPROC stylesheet.xsl fichier.xml > fichier-sortie.txt sur le terminal.
Résultats
RUBRIQUE 3210
RUBRIQUE 3214
RUBRIQUE 3224
RUBRIQUE 3476
RUBRIQUE 3546