Boîte à outils 4 : Des textes aux graphes

L'objectif de cette quatrième et dernière boîte à outils est de construire, grâce à l'outil patron2graphe, des graphes projetant les relations entre les termes d'un patron morphosyntaxique préalablement extrait. Les graphes permettent de visualiser de façon plus lisible et structurée ces relations.

patron2graph ne possède pas d’interface graphique, il est invoqué depuis un interprète de commandes. Le programme prend comme arguments : le codage et le fichier des patrons. Il se lance comme suit:

./patron2graphe.exe "codage" fichier_input

Cas des graphes issus de Cordial

Graphe de mots autour de la rubrique "A La Une"

Graphe de mots autour de la rubrique "International"


Cas des graphes issus de Treetagger

Graphe de mots autour de la rubrique "A La Une"

Graphe de mots autour de la rubrique "International"

Comparaison des résultats

Les graphes générés pour les deux rubriques « A La Une » et « International » que ce soit pour le cas Cordial ou bien Treetagger bien qu’ils présentent une certaine similarité, sont différents sur quelques points. Le graphe généré par la méthode Cordial inclut certains termes que l'on ne retrouve pas dans le graphe généré par la méthode Treetagger. celà s'explique à priori que l'une des deux méthodes apporte des informations différentes de l'autre. Il n’y a pas alors d’équivalence stricte entre les différentes étiquettes obtenues par les deux étiqueteurs. celà peut relever de différences intrinsèques aux programmes utilisés pour réaliser l’apprentissage des catégories.