La BAO 3 est la suite de la BAO 2 et met en oeuvre l'extraction de patrons syntaxiques des notres choix à partir des fichiers étiquetés obtenus précédemment.

Extraction de patrons à partir des fichiers obtenus grâce à Cordial


Ici, pour extraire les patrons, nous avions trois solutions possibles, chacune fournie par un professeur différent. Nous avons choisi celle de Serge Fleury, qui est disponible ici avec les patrons spécifiques à Cordial et le script d'automatisation du programme.En effet, il aurait fallu lancer manuellement le programme sur chacun des fichiers en fonction de chaque patron, ce qui aurait été assez long. Nous avons également décidé d'extraire les patrons NA (NOM ADJ) et NPN (NOM PREP NOM).

Voici un aperçu du résultat obtenu avec cette solution :


NOM ADJ

NOM PREP NOM


Cliquez ici pour télécharger les résultats de l'extraction NOM ADJ

Cliquez ici pour télécharger les résultats de l'extraction NOM PREP NOM



Extraction de patrons à partir des fichiers obtenus grâce à Treetagger


Pour traiter les sorties Treetagger, nous allons avoir recours à la bibliothèque XML::XPATH. Cela va nous permettre de parcourir l' arborescence des fichiers XML et d'en extraire les patrons requis, ici NA et NPN tout comme pour Cordial.
Le script est disponible ici


Voici un aperçu du résultat obtenu :


NOM ADJ

NOM PREP NOM


Cliquez ici pour télécharger les résultats de l'extraction NOM ADJ

Cliquez ici pour télécharger les résultats de l'extraction NOM PREP NOM