Sample image

Boîte à Outils 4

La Boîte à Outils 4 est la série finale dans laquelle les patrons (NOM PRP NOM et NOM ADJ et ADJ NOM) sont subis à l'analyse textométrique. Nous avons utilisé le programme Perl patron2graphml.exe qui prend en entrée un encodage UTF-8 (argument 0), une liste des patrons (argument 1), un motif (argument 2 est optionnel) et construit en sortie un fichier au format graphml. Ce programme est censé être utilisé sous le Windows depuis l’invite de commandes. Il y a 2 modes d’utilisation de ce programme :

Expériences

Nous nous sommes intéressées à savoir les noms (ou les adjectifs) associés aux adjectifs qui désignent les Etats-Unis, la Russie, l’Allemagne et l’Espagne dans la rubrique Europe. Nous avons fourni toutes les formes des adjectifs américain, russe, allemand, espagnole afin de pouvoir identifier les sujets des fils RSS de 2013. Nous avons exécuté la ligne de commande suivante : patron2graphe.exe "utf-8" europe-NOM_ADJ.txt motif-utf8.txt