contact

Boite à Outils n°4, aka BàO4

La finale partie. Euh... pardon, la partie finale!

Nous y sommes enfin : la toute dernière partie de notre travail !! Après avoir réalisé tous les traitements nécessaire sur notre corpus de base, nous pouvons désormais analyser le contenu de ces fils RSS !

Pour cette BàO 4, et contrairement aux autres BàO's, il n’y aura qu’une celle façon de procéder et donc qu’une seule étape. Pour cela, nous allons utiliser le programme patron2graphs.exe, qui a été développé par Monsieur Serge Fleury et qui fait partie des outils du trameur. Il ne fonctionne que sur Windows et se lance en ligne de commande. Le programme prend en entrée deux éléments obligatoire (l’encodage du fichier à analyser, ainsi que le fichier à analyser), et un élément optionnel (un fichier contenant un motif, ce qui va nous permettre d’orienter nos recherche).

Premiers amusements!

La ligne de commande ressemble donc à ça :

  • ./patron2graphe.exe utf8 Culture-extract-NOM_PRP_NOM.txt motif.txt

Presque pour le fun, nous avons essayé de lancer le programme tel quel, sans fichier de motif sur le fichier contenant les NOM_ADJ du fichier CULTURE, et nous avons obtenu un résultat clairement illisible :

images/bao4/graph_culture_sans_motif.png

Nous avons donc réfrénés nos ardeurs à vouloir prendre des raccourcis, et continués bien sagement.

Plus sérieusement...

Lors de notre analyse, nous avons décidé de ne prendre en compte que quelques rubriques : Culture, Économie, Europe, International, Société, Politique et Une1 (puisque c’est la plus volumineuse).

Rubriques par rubriques

Culture

Dans le fichier Culture, nous avons souhaité connaître l’image qu’avaient les français dans ce domaine, et le résultat nous montre que nous sommes présents dans beaucoup de domaines artistiques et culturels. Néanmoins nous pouvons également remarquer les mots « antisémite » et « soldats », dont l’emploi est bien surprenant dans cette rubrique.

images/bao4/graph_culture_francais.png

Economie

Dans le cas de la rubrique Économie, nous avons analysé les deux types de fichiers ; NOM_ADJ et NOM_PRP_NOM. Pour les NOM_ADJ, on remarque que les adjectifs les plus courants sont ceux de nationalité, puis viennent ceux qui qualifient les différents types d’économie. Ces graphes nous permettent ainsi de comprendre à quoi est associé notre motif … mais aussi à relever des coquilles ! Lorsque l’on regarde de plus près les adjectifs de nationalité, on note l’emploi du mot « niponne » (4 fois) et « nippone » (3 fois) ! Comme quoi, même les journalistes ne sont pas infaillibles…

Pour les NOM_PRP_NOM, nous pouvons noter que les termes employés sont relativement neutres.

images/bao4/graph_economie_economie.png

images/bao4/graph_economie_NOMPRPNOM_economie.png

Europe

Pour la rubrique 'Europe', nous n’avons traité que le fichier contenant les NOM_ADJ, et nous avons appliqué le motif « européenne ». Il en ressort tous les éléments qui font partit de l’Union Européenne : « politique », « commissaire », « union », « diplomatie », et etc.

images/bao4/mini_graph_europe_NOMADJ_europeenne.png

International

Nous avons ensuite appliqué le motif suivant sur le fichier International :

  • MOTIF=(\bmilitaire\b) | (bcrise\b) | (bprésident\b)

Ces mots n’ont pas été choisis au hasard, puisqu’en réalité, ce sont les substantifs les plus courants de cette catégorie. On remarque que pour le mot « miliaire » et « président », nous obtenons encore une fois une majorité de nationalité. Pour ce qui est de crise, nous nous retrouvons dans le même cas de situation qu’avec le fichier Europe, à savoir que nous avons les différents types de crises de l’année 2013.

images/bao4/international_NOMADJ_president_militaire_crise.png

Touche finale!

Enfin, l’année 2013 ayant été particulièrement riche en controverses et en débats, nous avons décidé d’appliquer le motif « (bpour\b) | (b\contre\b) » aux fichiers concernant les faits de sociétés, la politique, et la Une. On remarque que, même si il y a peu de « contre », les termes employés dans la partie «pour » relèvent plus souvent de condamnation ou de fautes pénales, que de réelles opinions sur un sujet.

On obtient alors les résultats suivant :

Société
images/bao4/graph_societe_NOMPRPNOM_pour_contre.png

Politique
images/bao4/graph_politique_NOMPRPNOM_pour_contre.png

Une
images/bao4/graph_une1_NOMPRPNOM_pour_contre.png

Pour revenir à la page d'accueil, cliquez-moi !