Résultats

La durée de traitement des trois premières boîtes à outils sur les flux RSS du Monde pour l'année 2014 prend environ huit heures et demie sur une machine qui possède 4 Go de RAM. Le dossier compte 5826 fichiers XML potentiellement exploitables pour un total d'environ 137428 articles. En tout, 132870 articles ont été traités selon le fichier de compte rendu feedback.cr.

Le traitement a permis de générer les graphes de la boîte à outils 4 que nous allons analyser brièvement.

La catégorie International

J'avais choisi de regarder le mot président et ses dérivés dans les motifs morpho-syntaxiques suivants : ADJ NOM, NOM ADJ et NOM PRP NOM.

Le patron NOM ADJ est celui qui présente le plus de résultats. Nous pouvons constater que les mots président, présidente et présidents sont très majoritairement suivis d'un adjectif de nationalité. Les articles font également référence à l'élection présidentielle afghane.

La catégorie Culture

Les graphes de cette catégorie montre bel et bien la polysémie de sortie. Cependant, je m'attendais à davantage de contextes. Cependant, certains contextes apparaissent un nombre conséquent de fois comme sortie de et de sortie.

La catégorie Sciences

Contrairement à mes attentes, le mot étude n'est pas très présent dans les articles de la catégorie sciences.

La catégorie Société

La racine viol prend en compte quelque dérivés tels que violence et violation.

Il est intéressant de remarquer que le mot violences est surtout utilisé avec des épithètes neutres (psychologiques, policières, volontaires, etc.) alors que son équivalent au singulier est accompagné d'épithètes afin de décrire d'un point de vue subjectif cette violence (insupportable, inédite, etc.)

Nous retrouvons également quelques locutions dont les journalistes aiment bien se servir tels que heurts violents, théâtre de violences, viols sur mineures, etc.