Boîte à outils IV

Les objectifs

Le but de cette BàO est de produire des graphes de mots grâce au programme patron2graphe qui fonctionne uniquement sur Windows. Le programme se lance en invite de commande de cette manière : patron2graphe.exe "encodage souhaité" (iso-8859-1 ou utf-8) fichierétiqueté motifsouhaité
Il est possible de ne pas préciser le motif afin d'obtenir toutes les relations entre les éléments du fichier de patrons, ce qui peut convenir pour des fichiers peu lourds.

Nous avons ici choisi de travailler avec les patrons issus de nos sorties Cordial. Nous avons utilisé les patrons syntaxiques NOM PREP NOM et NOM ADJ de quatre rubriques : International, Politique, Cinéma et Culture. Travaillant dans le cadre d'un autre cours sur le genre dans la presse (sur un corpus multilingue), notre choix s'est porté sur deux motifs de base : "homme" et "femme". En effet, la réputée neutralité du Monde nous intéresse en ce qui concerne la question du genre. Patron2graphe va ainsi nous permettre de voir quels sont les cooccurrents de ces deux motifs dans chacune des rubriques choisies.

Les résultats

Pour la rubrique "Culture" :





Pour la rubrique "Cinéma" :





Pour la rubrique "International" :





Afficher le graphe en taille réelle

Pour la rubrique "Politique" :





Afficher le graphe en taille réelle

Si les rubriques Culture et Cinéma offrent des graphes assez équivalents pour les deux motifs, avec des expressions toutes faites qui réapparaissent d'un fil à l'autre ("portrait de femme", "homme sans loi"), les rubriques Politique et International frappent déjà par la différence du nombre de formes, et donc d'occurrences, affichées : a priori, les femmes sont bien moins évoquées dans ces rubriques. Il faut cependant pondérer cette première impression par la présence dans les graphes du motif "homme" d'un emploi universel du mot, comme dans "droits de l'homme" ou "chasse à l'homme". Néanmoins, on remarque que pour la rubrique Politque, le motif "homme" est accompagné de nombreux adjectif mélioratifs ("intelligent", "droit", "de qualités", "de convictions"...) : ce genre de qualificatifs est totalement absent du graphe de "femme".
On remarque quelques étrangetés ("homme internationale" ?), peut-être dues à des erreurs d'étiquetage. A noter, le résultat peut être différent en utilisant l'étiquetage de Treetagger. Voici un exemple avec la rubrique Politique :





Afficher le graphe en taille réelle