Pour lancer le script: perl BAO_2_Regex.pl nom_du_répertoire nom_de_la_rubrique
Le script perl
On obtient deux sorties: l'une en txt et l'autre en xml.
À partir des sorties produites précédement, nous allons voir comment extraire des patrons morphosyntaxiques avec des scripts perl, python et des outils XML (xslt, xQuery).
On obtient deux sorties: l'une en txt et l'autre en xml.
On obtient en sortie un fichier .txt.
En utilisant les scripts présentés précédemment, nous recherchons les patrons suivants dans les fichiers annotés générés dans BaO_2:
NPP V P NPP -> Afin de trouver des résultats de matchs (victoire d'une équipe sur une autre)
V DET NC NPP NPP -> Verbe + une profession / poste / rôle + nom d'une personne (sportif, entraineur, journaliste, etc)
NC P NPP P NC -> Dans le but d'extraire les noms de championnats de toutes disciplines sportives
2017:
Patron 1:
Patron 2:
Patron 3:
2018:
Patron 1:
Patron 2:
Patron 3: