BAO4

Transformation de la sortie BAO3 en graphes

Parmi les patrons morphosyntaxiques choisis à l'étape BAO3, celui qui contient le plus d'information sémantique est Verbe déterminant nom adjectif.
Pour trouver les noms les plus fréquent dans ce modèle, on peut utiliser la commande :
cat fichier_sortie_bao3.txt | cut -d ' ' -f3 | sort | uniq -c | sort -k1rn
Et là on trouve que les noms les plus fréquents de la rubrique 3208 dans ce modèle sont "président", "enquête" et "maillot".

On peut considérer ces mots comme motifs pour lancer le programme patron2graphe.
patron2graphe.exe "codagedes2fichiers" FichierEnEntree FichierContenantLeMotif

Sortie Cordial

Sortie Treetagger

En 2017, nous avons connu l'élection présidentielle en France et l'arrivée au pouvoir d'un nouveau président américain. Ce mot a une haute fréquence dans les syntagmes correspondant au modèle "v + det + nom + adj".
Les combinaisons "le président américain" et "la campagne présidentielle" sont les plus fréquente d'après les deux graphes.
Ce qui différentie les deux graphes, c'est les liens qui contiennent le mot "élection" : pour Tree-tagger, "l'élection" est un nom alors que Cordial pense que c'est DET + NOM. Par conséquent c'est le résultat de Cordial qui correspond à notre patron ici.

Sortie Cordial

Sortie Treetagger

"une enquête préliminaire" est la plus fréquente combinaison selon les deux graphes.
Il y a toujours la différence sur le traitement de l'élision entre les deux outils. Par ailleurs, Cordial considère des expressions telles que "être l'objet de" comme un verbe alors que Treetagger pense que c'est une suite de plusieurs mots.

Sortie Cordial

Sortie Treetagger

"endosse le maillot jaune" et "conserve son maillot jaune" sont les plus fréquentes combinaisons.
Les deux outils donnent des résultats identiques.

En tant qu'apprenant du français, je trouve personnellement que faire de tels graphes aide à enrichir le vocabulaire. En plus des valeurs pour le TAL, c'est aussi une bonne manière d'apprendre l'usage des mots, de connaître avec quels mots un certain mot est souvent utilisé.