Résultats & Analyses

Nous avons utilisé des scripts pour recueillir notre corpus et le rendre exploitable. La suite du travail consiste à utiliser des outils textométriques divers pour tirer des informations statistiques et linguistiques de notre corpus. Nous allons voir dans cette partie le résultat de notre travail : quels phénomènes sont observables sur notre corpus, et quelles conclusions en tirer ?

Trameur

Nous avons utilisé le logiciel de statistiques textuelles Trameur de Paris 3 pour obtenir les résultats suivants.

Graphes de coocurrences

L'analyse de la coocurrence cherche à montrer quels sont les mots que l'on retrouve le plus fréquemment à la proximité d'un pôle donné. En l'occurence, notre pôle est "septembre". Pour calculer cette "fréquence de proximité", le Trameur se base sur deux données : la fréquence d'apparition du mot dans le texte total ; sa fréquence d'apparition à proximité du pôle. La notion de proximité étant définie dans notre cas comme la présence des deux unités dans la même phrase.

Les graphes suivants représentent les mots possédant la plus forte coocurrence avec "septembre" ou son équivalent dans chaque langue. La sensibilité de la recherche a été réglée de telle sorte que peu de résultats apparaissent : uniquement les plus fréquents. Nous vous présentons donc des résultats plus ciblés, plus écrémés, mais en perdant la possibilité d'exploiter des données moins saillantes.

Dans le corpus français, l'étude de la cooccurrence des termes avec le terme "septembre" met tout à fait en avant les détails temporels des événements, on retrouve le chiffre 11 mais aussi l'année : 2001, les mots "Etats" et "Unis"ainsi que "Jihad" et "attentat" au singulier et au pluriel.
Un point intéressant à noter est la présence du mot "du", l'ensemble des ces termes nous permettant clairement (pour un locuteur natif du moins) de reconstruire la locution "attentats du 11 Septembre 2001" qui est une dénomination fréquente de l'événement en français. Ce graphe ne met en avant que le vocabulaire propre à la dénomination et la description pure des attentats.

L'arbre des cooccurrences allemandes avec le mot "September" est bien plus important, nous n'analyserons donc pas tous les termes présents mais ceux qui nous semblent les plus intéressants.
On y retrouve de façon très fréquente les termes 11 ainsi que 2001 bien sûr, "World", "Trade" et "Center" ainsi que "New" et "York", en bref, encore une fois tous les détails techniques des événements.

En revanche, on voit apparaître des termes plus intéressants semblant être plutôt du côté de l'analyse des événements tels que "Selbstmordplan" (attentat suicide, littéralement "plan de suicide") et des termes plus politiques comme "Verantwortung" (responsabilité), "Wahrheit" et un terme en anglais "Truth" (vérité) ou "Verschwörung" ce qui veut dire "complot", "Außenminister" (ministre des affaires étrangères) ou "Festnahme" (interpellation) : on voit là les marques d'un article non plus descriptif mais analytique se penchant sur les raisons hypothétiques des événements ainsi que sur les suites des attentats (nature : complot, à qui revient la responsabilité, le problème des arrrestations, comment obtenir la vérité, personnes impliquées dans ces questionnements, etc.)

Enfin, un dernier terme nous a interpelé dans ce graphe : celui de "Jahrestag" qui signifie anniversaire et laisse à penser que bon nombre des articles sélectionnés datent d'une période bien postérieure aux événements et ont donc été publiés aux alentours de la date anniversaire du 11 septembre, dans une démarche de sensibilisation, de rappel ou encore de mémoire peut-être ?

Treecloud

Treecloud est un outil lexicométrique lui-aussi basé sur le calcul des cooccurrences, mais il ne les calcule pas uniquement par rapport à un pôle unique. Au contraire, Treecloud sélectionne toutes les unités lexicales (et pas les unités grammaticales) dépassant un certain seuil de fréquence, et les compare entre elles pour déterminer un réseau de proximités, et dresser un arbre les représentant. Le résultat peut s'apparenter à une représentation sémantique du texte, puisqu'elle reflète les mots les plus fréquents et leurs associations. Son autre avantage est qu'en conservant les relations de proximité entre toutes les unités, les expressions comme "world trade center" sont conservées.

Au même titre que les nuages précédemment générés on constate ici que le mot 'septembre' reste l'élément central du corpus et cela malgré la présence de bruit. On constate également du fait d'un taux d’occurrence élevé, une forte présence des termes qui s'inscrivent dans le champs lexical direct du « 11 septembre » : Bin-Laden, attentats, victimes, tours, New york, états-unis, terrorisme, avion,... mais aussi des termes relatifs aux conséquences de l'événement : procès, tribunal, accusés, enquête...
De ces points on peut conclure que le corpus français tel qu'illustré par le graphique est beaucoup plus axé sur la description de l'événement.

On constate que pour ce graphe (malgré la présence de bruit) reflète l'étymologie du 11 septembre avec les principaux mots clés : attacks, terrorist, Wall Street, World Trade Center, Security, America , USA, Osama Bin-Laden, Al-Qaeda. Ce type de terminologie est utilisé dans un but descriptif.

On peut malheureusement voir au premier coup d'oeil que l'analyse du corpus en allemand ne donne pas des résultats aussi intéressant. Le corpus présente probablement des défauts plus nombreux que celui des autres langues, de façon difficilement repérable à l'oeil nu. Cela peut venir par exemple d'une quantité de paratexte trop importante (cela peut justifier la présence du nuage de mois).

L'outil Treecloud ne dispose malheureusement pas de dictionnaire des mots grammaticaux de l'arabe. Pour cette raison, créer un graphe du corpus de l'arabe serait peu intéressant.

Nuages

Les nuages en forme de pays ont été réalisés à l'aide de l'outil Taxedo, les nuages horizontaux à l'aide de Wordle, d'après les fichiers dump totaux de chaque langue. Nous avons utilisé ces deux outils apparemment redondants dans le but d'avoir des résultats plus variés, ou dans le cas contraire plus fiables.

On s'aperçoit ici que les mots les plus fréquents (donc les plus gros) et ceux qui suivent traitent directement l'information (on voit beaucoup de termes directement liés à ce qui s'est passé tels que "World", "Trade" et "Center" ou encore "USA" ou "Flugzeug" (avion) mais aussi de politique, on voit ainsi des mots ayant trait à la guerre "Krieg" au gouvernement ("Regierung", "Politik", Präsident") ainsi que les noms clefs de ces événements ("Osama", "Bin", "Laden" ou "Obama", "Bush", etc.) ainsi enfin qu'à l'enquête et le coup médiatique qui ont suivi ("FBI", "Report", "Film", "Bericht" : compte-rendu).

Pour ce qui est du corpus français en revanche, le vocabulaire est orienté, lui aussi, sur les faits eux-mêmes ("tours", "septembre", "avion", "New", "York", etc.), mais le reste semble principalement aborder le sujet des victimes. En effet, parmi les mots qui apparaissent très souvent, on trouve "familles", "victimes", "mort", "justice", "enfants", etc. Cet ensemble d'articles, bien qu'orienté aussi vers la descritpion des événements et des suites policières et politiques, met bien en avant le côté dramatique de l'événement.

Bien que le nuage prenne la forme des Etats-Unis, ce n'est qu'une illustration, nous rappelons que notre corpus anglais ne contient pas préférentiellement des articles issus de sites américains.

Enfin, le corpus anglais se tourne lui beaucoup vers la politique. En dehors des termes banals trouvés dans chaque corpus comme "center" ou "September", on trouve cette en beaucoup plus gros (et donc plus fréquent) les termes "president", "bush", "war", mais aussi "Pentagon", "terrorism", "american", "security", "government" et autre termes du champ lexical de la politique.

Comme pour les langues traitées ci-dessus, on retrouve en arabe les principaux termes en rapport avec l'étymologie du 11 septembre : Amérique, Wallstreet, Pentagon, attaques, Bush, avions, Terrorisme, guerre, Al-Qaïda.

L'essentiel de ces termes sont utilisés à but descriptif de l'événement bien que la présence de termes tels que : Vérité, guerre froide, stratégie à plus faible occurrence suggère la présence d'éléments ayant trait avec les théories conspirationnistes.

On s'aperçoit donc que les articles journalistiques ont abordé sous un angle légèrement différent le traitement de l'information sur les attentats du 11 Septembre 2001. Bien qu'on retrouve de façon récurrente les termes décrivant ce qui s'est passé, les points importants qui apparaissent à la lueur des fréquences de termes lexicaux ne sont pas les mêmes selon la nationalité des auteurs.