BAO 4





BAO 4 consiste à produire des graphes de mots grâce à l'application du programme patron2graphe.exe (fichier à télécharger).Notons qu'il faut l'utiliser sous Windows. L'application se lance à partir de la commande qui suit:

./patron2graphe.exe "iso-8859-1" fichier-patrons.txt fichier-motif.txt

Nous pouvons ne pas préciser le motif pour obtenir toutes les relations entre les éléments du fichier patrons. Mais, la sortie sera lourde et confuse bien qu'elle soit riche en information:


Nos fichiers patrons sont les fichiers que nous avons obtenu de BAO 3 avec Cordial, c'est pourquoi notre encodage est en "iso-8859-1". Nous avons décidé de choisir deux motifs: "travail" et "crise". L'actualité et la crise de nos jours nous ont poussées à choisir ces mots clés pour voir en quoi la crise a un impact ou non sur le travail. La notation du motif se fait comme suit: " MOTIF=\bcrise* " ou MOTIF=\btravail*. Patron2graphe va ainsi permettre de voir quels sont les cooccurrents de ces deux motifs dans chacune des rubriques. Par contre, nous n'avons pas sélectionné des rubriques fixes pour lancer le programme mais nous avons pris les sorties qui nous semblaient saillantes.


Corpus
    Notre corpus est constitué de fils RSS du journal "Le Monde". Nous avons démarré notre projet avec le fichier 2008 constitué de fils RSS des journaux de 15 jours car le fichier 2014 étant lourd prenait un temps considérable pour tester les traitements.


BLOG BAO 1 et 2