Dans la première phase du projet, la BAO1, nous avons extrait le contenu d'un grand nombre de fichiers en parcourant une arborescence de dossiers. Nous avons récupéré ce contenu sous format .txt et .xml, deux formats que nous avons exploités dans la BAO2 afin d'étiqueter le contenu de nos fichiers en parties du discours. Puis, ayant donné une "identité" à chaque mot de nos fichiers, nous avons pu extraire des patrons syntaxiques dans la BAO3 sur la base de cette identification. Maintenant, il s'agit d'exploiter ces données dans une analyse textométrique et pour cela nous allons les visualiser au moyen d'un programme qui s'appelle patron2graphe.exe réalisé par M. Serge Fleury et intégré dans le Trameur.
L'outil se lance en ligne de commande seulement, mais rien de compliqué. Il est fourni avec un mode d'emploi très clair et la liste des arguments est clairement indiquée. Pour le lancer donc, il faut télécharger le dossier, le dezipper et se placer dedans. Puis appeler le programme en listant dans l'ordre les arguments. Selon que le lancement se fait sur la l'invite de commande Windows ou sur Cygwin (ou Linux) un seul détail change, le "./" :
La première ligne permet d'afficher dans un graphe toutes les formes qui se trouvent dans le fichier de patrons. Plus il y en a et plus le résultat risque d'être illisible. Pour un fichier de taille réduite, il suffit de déplacer les boites de mots pour y voir plus clair. Mais on peut aussi filtrer les résultats en cherchant une forme en particulier par exemple pour retrouver dans la liste des patrons "NOM-ADJ" du fichier Environnement, ceux qui contiennent le motif "danger", c'est ce que permet de faire la deuxième ligne.
Bon à savoir : il n'est possible de réecrire la ligne de commande qu'une fois la boite du graphe fermée.
Exemple de sortie:
On peut faire varier les motifs selon les besoins par rapport aux catégories et/ou par rapport aux patrons. Bien sûr, lorsque l'on souhaite travailler sur un motif en particulier il faut adapter son choix des patrons syntaxiques en amont.
Exemples de sortie :
comédie / drame (catégorie cinéma)
film / cinéma (catégorie cinéma)
travail / chômage (catégorie société)
homme / femme (catégorie société)
danger (catégorie environnement)
pollution (catégorie environnement)