BAO4 : La visualisation des patrons

L'objectif de cette étape consiste a visualiser les patrons syntaxique issu de l'extraction réalisé par BAO3 et de réaliser une analyse textométrique

Pour cela, nous allons utiliser le programme patron2graphe qui a été développé par Monsieur Serge Fleury et qui fait partie des outils du trameur.Il ne fonctionne que sur Windows et se lance en ligne de commande


Pour exécuter ce programme, il faut:

1. le programme : patron2graphe.exe

2. l'encodage du fichier d'entrée:"iso-8859-1"

fichier d'entrée: patron1.txt(c'est le fichier qu'on obtient à BAO3

4. si on veut uniquement des noeuds obtenus par filtrage prealable du motif dans les patrons, il faut aussi un fichier des motifs


Le programme prend en entrée deux éléments obligatoire (l'encodage du fichier à analyser,ainsi que le fichier a analyser), et un élément optionnel(un fichier contenant un motif,ce qui va nous permettre d'orienter nos recherches).

La ligne de commande est la suivante

./patron2graphe.exe "ENCODAGE DU FICHIERDENTREE" FICHIERDENTREEE FICHIERMOTIF


Pour tester le programme,nous avons essayé de lancer ce dernier tel quel, sans fichier de motif sur l'une des rubriques et nous avons obtenu un résultat clairement illisible

Resultat du graphe sans motif:

Lors de notre analyse,nous avons décidé de ne prendre en compte que quelques rubriques: A la une (3208) et international(3210)

RUBRIQUE INTERNATIONAL : 3210

MOTIF=(\bmilitaire\b)|(\bcrise\b)|(\bprésident\b)


Ces mots n'ont pas été choisis au hasard, puisqu'en réalité, ce sont les substantifs le plus courants de cette catégorie.On remarque que pour le mot<> et <>, nous obtenons encore une fois une majorité de nationalité. Pour ce qui est de <> nous retrouvons tous les différents types de crises de l'année 2016

Résultat du graphe avec motif


NC ADJ


NC ADJ

RUBRIQUE Ala une : 3208

MOTIF=\bpolit sur le fichier ALAUNE-NC-PREP-NC


Résultat du graphe avec motif


NC PREP NC


MOTIF=\bpolit sur le fichier ALAUNE-NC-ADJ

Résultat du graphe

NC ADJ

On voit donc que pour le motif<> l'expression réguliere prend aussi en compte le nom au pluriel.Ainsi ,ce graphe se divise en deux parties:

singulier d'un coté, et au pluriel de l'autre.Les deux se rejoignent cependant sur le même article "les"

On peut ainsi faire de multiples recherches de sortie BAO3 à partir de ces graphes,et s'en servir pour analyser les faits d'actualités décrits dans le journal Le Monde

Pour une bonne visualisation des graphes cliquez

  • ici