Extraction de patrons sur les sorties de l'étiquetage issues de la BAO2. On utilisera les programmes.xml (TreeTagger) et programmes.udpipe.xml(UDpipe).

Voici les patrons extraits :

  • NOM PRP NOM PRP
  • VER DET NOM
  • NOM ADJ
  • ADJ NOM
  • NAM NAM
  • ADV VER

Le programme en Perl

Le programme en Python

XSLT/PATH

Les résultats à partir de UDpipe avec le programme Python

Idée

Cinéma


Les résultats à partir de TreeTagger avec le programme Perl

Idée

Cinéma


XSLT/XPATH (sur un extrait de 5000 lignes)