Le script perl

On obtient deux sorties: l'une en txt et l'autre en xml.

BAO_3.pl

Pour lancer le script: perl BAO_2_Regex.pl nom_du_répertoire nom_de_la_rubrique


Le script python

On obtient en sortie un fichier .txt.

bao3.py

Pour lancer le script: perl BAO_2_Regex.pl nom_du_répertoire nom_de_la_rubrique


Les patrons recherchés

En utilisant les scripts présentés précédemment, nous recherchons les patrons suivants dans les fichiers annotés générés dans BaO_2:

NPP V P NPP -> Afin de trouver des résultats de matchs (victoire d'une équipe sur une autre)

V DET NC NPP NPP -> Verbe + une profession / poste / rôle + nom d'une personne (sportif, entraineur, journaliste, etc)

NC P NPP P NC -> Dans le but d'extraire les noms de championnats de toutes disciplines sportives

Résultats obtenus

2017:

Patron 1:

sortie-bao3-sport-2017-1.txt

Patron 2:

sortie-bao3-sport-2017-3.txt

Patron 3:

sortie-bao3-sport-2017-3.txt



2018:

Patron 1:

sortie-bao3-sport-2018-1.txt

Patron 2:

sortie-bao3-sport-2018-3.txt

Patron 3:

sortie-bao3-sport-2018-3.txt