dots


Nuages de mots

    Les nuages de mots nous permettent de visualiser les résultats de notre script. Nous avons utilisé un programme qui s'appelle WordItOut pour construire ces nuages. WordItOut prend en entrée un texte (par exemple nous pouvons copier-coller un extrait de texte, lui donner un URL ou tableau à aspirer) et crée une illustration avec ces mots, en fonction de la fréquence de chacun. Plus un mot apparaît dans le texte, plus grand il devient dans l'image. WordItOut est un site parmi plusiers qui offrent le même genre de visualisation. Il existe aussi les sites Wordle et Tagxedo par exemple.

    Nous avons créé ces nuages de mots avec les fichiers de "contexte global" que notre script génère. Il existe un fichier "contexte global" pour chaque pays, donc deux par langue. Cela a pour but de visualiser nos résultats de façon à les comprendre en un clin d'œil.

    On observe qu'à part le terme recherché, les mots vu le plus souvent sont des mots grammaticaux qui ne figure pas sur les stop-listes. Ces mots sont généralement retirés en anglais, mais en français et portugais ceci doit être fait à la main. Comme le tri de ces mots n'est pas normalisé, ces analyses ne sont qu'indicatives.

Anglais de la Grande Bretagne

cloud

Anglais des Etats Unis

cloud

Français de la France

cloud

Français du Canada

cloud

Portugais du Portugal

cloud

Portugais du Brésil

cloud