• Nuages de mots

Les nuages de mots ci-dessous ont été obtenus en utilisant le site de création de nuages Word Art, avec comme entrée, la concaténation des fichiers dump-text par langue. Ici, chaque nuage représente donc le corpus d’une langue. Ces nuages permettent d’illustrer la fréquence d’apparition des mots de nos corpus : plus un mot apparaît dans le texte, plus il occupera de l’espace dans le nuage. Cette visualisation permet d'avoir un aperçu global sur nos résultats.

Dans la concaténation des fichiers dump-texts, les dénominations du terme "Union Européenne" ont remplacé par son sigle "UE" dans chaque langue, permettant ainsi l'uniformisation des données. Nous avons de plus, essayé de retirer à la main, le plus grand nombre de mots-vides (stop-words) possible dans chacune de nos langues, afin d'avoir une représentation plus pertinente de nos données. Après ce tri, nous pouvons remarquer qu'autour du terme recherché, le terme Brexit semble être plus présent du côté français et allemand que dans l'anglais britannique et le grec (poids moins important) ou encore le portugais (mot non visible dans le nuage). Il n'y a que dans le corpus portugais, où le thème du Brexit semble être absent. Après l'UE, l'Euro et le Portugal, les mots qui reviennent le plus dans le nuage portugais sont : année, information, millions, mille, pays, entre, politique... Mais aucune mention du Royaume-Uni, contrairement aux quatre autres langues qui ont en commun dans les mots distinguables "Brexit", "Royaume-Uni", et "nouveau".

 

Zoom sur le nuage français (FR), anglais (EN) , allemand (DE) , grec (EL), ou portugais (PT)