Entrée : 3210-cordial-nomnom.txt
Sortie : graphe
Explications :
Pour réaliser cette dernière boite à outils, il nous faut télécharger une archive contenant un petit programme exécutable sur la page iCampus. Ce programme s'utilise en invite de commande Windows de la façon suivante :
patron2graphe.exe "encodage" fichier
Exemple :
patron2graphe.exe "utf-8" 3210-cordial-nomnom.txt
Le résultat est un graphe comme celui-ci :
Comme on peut le voir, le graphe n'est pas très lisible. Par souci de clarté, nous pouvons utiliser un motif pour cibler la recherche des patrons. Le programme s'utilise alors de la façon suivante :
patron2graphe.exe "encodage" fichier motif
Exemple :
patron2graphe.exe "iso-8859-1" patrons-1.txt motif-iso-8859-1.txt
Le résultat est un graphe comme celui-ci :
Cet exemple, fourni dans le mode d'emploi du programme, effectue une recherche autour du pôle polit- . Toutefois, cette utilisation ne convient pas au traitement de nos fichiers : il nous faudrait en effet trouver un motif, ce qui est infaisable dans les listes d'entités nommées que nous avons.
Comme nous l'avons vu, la première méthode produit un graphe illisible et la seconde méthode n'est pas appropriée à la nature de nos fichiers. Nous avons donc expérimenté deux autres méthodologies, que nous détaillons dans la rubrique "Entités nommées".