Boîte à outil 4 : Mise en forme des résultats pour analyse textométrique

Objectif

La dernière étape de notre projet consiste à mettre en forme les patrons syntaxiques qui ont été extraits du corpus en vue de faire une analyse textométrique des fils RSS du journal le Monde.

Représentation sous forme de graphes

Les données peuvent être représentées sous forme de graphes grâce au programme parton2graphes.exe.

Une première commande permet d'obtenir une vue d'ensemble des relations sémantiques entre les mots se trouvant dans le fichier d'entrée des patrons syntaxique :

#patron2graphe.exe "codagedes2fichiers" FichierEnEntree
patron2graphe.exe "iso-8859-1" Cordial-Europe_NC_ADJ.txt

Voici le résultat obtenu pour le patron syntaxique NC ADJ sur la rubrique Europe :


À partir d'un fichier supplémentaire contenant un motif de recherche, il est possible travailler sur une partie seulement de ce graphe :

MOTIF=\bcrise\b

patron2graphe.exe "iso-8859-1" Cordial-Europe_NC_ADJ.txt motif-iso-8859-1.txt

Résultat :

Voici d'autres exemples (il est possible de déplacer librement les mots du graphe pour "une meilleure lisibilité") :

  • Graphe du motif "\beuro\b" sur le fichier de patron DETDMS NCMS DETDMS NCMS de la rubrique Europe :
  • Graphe du motif "\bemploi" sur le fichier de patron NC ADJ de la rubrique Société :