BAO 4

Présentation

Dans la dernière étape, l'objectif est de créer des graphiques à partir des résultats de la boîte à outil 3 en utilisant patron2graphe.exe. Comme c'est une application .exe, elle ne marche que sur Windows. Après avoir testé avec le motif donné par les professeurs, nous avons décidé d'observer les graphiques avec les motifs VERBE PREP et VERBE DET NOM pour comparer le verbe "défendre" dans ses emplois transitifs et intransitifs.

On applique le motif
(MOTIF=\b((défends?)|(défendre)|(défendent)|(défendait)|(défendaient))\b)
à deux rubriques en particulier : international et une. Comme nous avons deux sortes de sorties grâce aux deux scritps utilisés dans la boîte à outil 3, on compte comparer les graphiques basées sur les différentes sorties.

Télécharger les fichiers de motifs, télécharger les graphiques.

Analyse des résultats

Le verbe "défendre" existe à la fois comme un verbe transitif et intranstif dans les deux rubriques. Mais nous avons obtenu des graphiques différents selon les différentes sorties des scripts. Par exemple, la graphique "une" montre trois conjugaisons du verbe "défendre" : "défend" et "défendent" et "défendre", alors que le graphique basé sur le script d'extraction brut a seulement "défendre" pour toutes les branches. En outre, ence qui concerne la rubrique "international", le graphique tiré de la sortie du script brut montre plus d'exemples par rapport à celui du script XML::PATH. En plus des exemples qui correspondent au motif désigné, il apparaît aussi des exemples dits incorrects. Par exemple, dans le graphique des verbes transitifs, il y a "défendre l'université des" comme une branche qui ne correspond pas au motif VERBE DET NOM. Il y a trop de mots. La tokenisation avant l'étiquetage s'est sans doute mal faite.

Après l'observation des résultats, on suppose que les deux scripts de boîte à outil 3 sont différents, même s'ils traitent les mêmes entrées et visent à obtenir les mêmes sortes de résultats. C'est peut-être parce qu'ils ont des différences de structures internes ou bien parce qu'ils traitent les données de manières différentes ou encore parce qu'ils traitent des données étiquetées par deux logiciels différents. Les fifférents graphiques obtenus peuvent le confirmer à un certain degré.