la vie trilingue de l'identité nationale sur le web

Deuxième phase du projet : la création de nuages de mots-clés ou tag clouds.


Nous utilisons pour cela nos fichiers de contextes-globaux créés pour chaque langue et un outil en ligne pour analyser notre contexte.

Les outils

Dans les deux cas, le but est d’obtenir un nuage pertinent qui nous permet de visualiser le contexte du mot étudié. Plus un mot se répète et plus il est mis en valeur dans le nuage.

La première difficulté consiste donc à retirer tous les mots vides tels que les mots grammaticaux qui se répètent beaucoup mais ne nous renseignent sur rien de particulier.

Si les deux outils nous permettent de retirer ces mots vides de notre liste, les deux méthodes sont différentes.

WordItOut et Wordle se différencie également par les possibilités de formatage du nuage.


WordItOut


Il permet de créer en une seule fois liste des mots que nous ne souhaitons pas voir apparaître dans le nuage. Il permet également d'inclure ou d'exclure des mots directement depuis note liste de mots via l'onglet "word list" ce qui facilite beaucoup l'exclusion des mots inutiles et qui permet aussi de vérifier que des mots importants ont bien été pris en compte. Au niveau du choix du formatage, cela reste assez basique mais le rendu est lisible.

Nuage Français avec WordItOut
Le nuage français généré avec WordItOut
Nuage Arabe avec WordItOut
Le nuage arabe généré avec WordItOut
Nuage Arabe avec WordItOut
Le nuage russe généré avec WordItOut

Wordle


Il supporte plus de langues et peut enlever automatiquement les mots vides associés à chaque langue. Il reste cependant nécessaire de supprimer quelques mots du nuage en cliquant dessus un à un. Au niveau du design, il permet un rendu visuel plus intéressant grâce à un très large choix d’options de formatage notamment au niveau de l’orientation du texte et des couleurs même si l’on peut regretter que le résultat ne soit pas toujours très lisible.

Nuage Français avec WordItOut
Le nuage français généré avec Wordle
Nuage Arabe avec WordItOut
Le nuage arabe généré avec Wordle
Nuage Arabe avec WordItOut
Le nuage russe généré avec Wordle

Quelques remarques

Dans les trois langues le mot qui apparaît le plus est « identité » ce qui est tout à fait évident puisqu’il s’agit de notre motif.


Ce qui est très intéressant en revanche c’est de voir qu’aussi bien dans les textes relatifs à la France que ceux relatifs à la Tunisie, les mots qui reviennent le plus lorsque l’on traite de la question de l’identité (hormis les mots "France"/ "Tunisie") sont (sans ordre particulier) : aujourd’hui, construction, bataille, crise, peur, République, pays, question, civilisation, nous, eux, tous, gauche, sens, valeurs, etc.


Malgré ces nombreuses similitudes très frappantes dans les discours des deux pays on notre des différences très significatives. En France on parle beaucoup d’"immigration" et d’"intégration". Alors qu’en Tunisie ce sont les mots "arabe" et "islam" qui ressortent le plus.


Ce qui est intéressant ici c’est de voir cette similitude dans la construction du discours politique autour de l’identité nationale dans un contexte si différent. En France, celui qui occupe la place de l’"autre" dans le débat sur l’identité nationale c’est l’étranger ou l’immigré. C’est de l’extérieur que viendrait la menace contre l’"idéal" français. On voit alors apparaître des mots tels que "tolérance", "ethnoculturelle", "communauté". La présence du mot "pathologie" nous renseigne sur le caractère assez passionné des débats et du discours sur l’identité nationale. Tandis qu’en Tunisie cette menace est intérieure et est représentée par une certaine frange de la population que l’on estime pas assez arabisée et islamisée et dont interroge de fait la "tunisiannité". Cette même frange de la population à son tour remet en question la "tunisiannité" de ceux qu’elle estime wahhabisés. On note d’ailleurs dans le nuage en arabe la présence de mots tels que "occidentalisation" et "barbus".


Le nuage russe lui est assez différent des nuages français et tunisien. Les mots qui y reviennent le plus souvent sont "identité de soi", "liberté", "modèle", "religieux", "islamique" ou encore "Tchétchénie" ainsi que des références au Daguestan qui nous renseigne à eux-seuls sur le contexte géopolitique particulier dans le cadre duquel la notion d’"identité Russe" est évoquée. Autre mot intéressant dans le nuage Russe c’est le terme "sang" qui réfère ici non pas à quelque chose de meurtrier mais à l’expression "l’identité nationale ne se situe pas dans le sang mais dans l’âme".