Boîte à Outils n°4

Nous arrivons maintenant à la concrétisation de notre projet : la représentation de nos motifs syntaxiques en graphes !

Le logiciel utilisé pour cette tâche est patron2graphe (téléchargeable sur le site du cours), qui s'utilise en ligne de commande. Le programme prend en argument un encodage à spécifier, un fichier contenant les patrons et un fichier contenant le motif à prendre en compte. Par exemple pour le fichier de patrons NOM ADJ de la rubrique ALAUNE :

./patron2graphe "iso-8859-1" ALAUNE-Nom_Adj.txt patron.txt

On peut aussi lancer le programme sans le fichier patron.txt, mais cela nous donne un résultat plus qu'illisible :

En effet, si l'on ne précise aucun motif de recherche au programme, il prend en compte tous les mots du fichier passé en entrée... Pour obtenir un meilleur rendu, il nous faut donc spécifier le motif à rechercher dans ce fameux fichier patron.txt. Regardons par exemple ce que cela nous donne en prenant comme motif MOTIF=[Mm]ariage sur ce même fichier ALAUNE-Nom_Adj.txt :

Enfin quelque chose d'analysable ! On voit donc que pour le motif [Mm]ariage, l'expression régulière prend aussi en compte le nom au pluriel. Ainsi, ce graphe se divise en deux parties : les suites NOM ADJ au singulier d'un côté, et au pluriel de l'autre. Les deux se rejoignent cependant sur le même adjectif "gay", bien qu'il n'y ait qu'une seule occurrence de cette suite "mariages gay". Cela pose la question de l'accord entre un mot français suivi d'un emprunt, l'auteur de cette suite NOM ADJ ayant préféré laisser l'anglicisme invariable.

Voyons ce que l'on obtient avec le fichier contenant les suites NOM PREP NOM :

Ici, on n'a aucune dérivation du nom "mariage", ni même en majuscules. On remarque que les liaisons sont moins anarchiques, puisque les suites Nom-Prep-Nom ont moins de chance d'avoir beaucoup des cooccurrents en communs par rapport à la suite Nom-Adj.

On peut ainsi faire de multiples recherches sur nos fichiers de sortie BAO3 à partir de ces graphes, et s'en servir pour analyser les faits d'actualités décrits dans le journal Le Monde.