Le menu



Accueil

Le Mot

Les Scripts

Les Outils

Les Tableaux

Des Nuages

Un Bilan

Nuages

Il existe plusieurs sites permettant de faire des nuages de mots qui font ressortir la fréquence des occurrences :
  • Wordle
  • Tagxedo
  • WordItOut
  • Tagul
  • Twittersheep
  • Quintura
  • Tagcrow
  • Vocabcrabber
  • Wordsift
Il suffit soit de copier un texte, soit de lui indiquer une URL. Les fichiers globaux de dump sont très lourds et nous avons donc utilisé les fichiers globaux de contexte par langue.

Pour le français

On s´aperçoit que le codage n'est pas parfait : il y a beaucoup de & eacute ; et autres caractères html, on note aussi les majuscules accentuées ou non, qui évidemment, apparaissent sous plusieurs formes différentes.
On peut en tirer des conclusions sur l'importance d'avoir un texte homogénéisé avant tout traitement statistique.
D’autre part, certaines polices ne possèdent pas de caractères accentués et laissent donc des blancs à la place.

Pour l'anglais

WordleGBDans Wordle, il y a tellement de "Writing" que l’on ne voit plus rien d’autre.

WordItOutGBEn revanche avec WordItOut, il est possible de limiter le nombre d’occurrences d’un mot, et donc de résoudre ce problème.

Tagxedo est très configurable (police, couleur, forme, etc...).

Pour le hindi

hindiWordle détecte automatiquement qu’il s’agit de hindi et retire les mots vides dans cette langue (par contre il ne le fait que pour les langues en iso-latin dont l'arabe).

Tagxedo ne traite carrément pas le devanagari et donne une série de jolis carrés vides.

WordItOut, lui, ignore uniquement les stop words (mots vides) anglais et les signes de ponctuations et autres < > ou & propres au html.

Voici donc le résultat Wordle, mais vous trouverez l'image ici.

Pour le chinois

TagxedoC

Wordle

Beaucoup de jolis carrés que vous pourrez voir en cliquant ici.

Tagxedo Marche très bien comme vous pouvez le voir et on peut préciser les mots que l'on veut. Et le 文字 (écriture) apparaît juste au milieu du trèfle à quatre feuilles !

WordItOut Le résultat s'affiche correctement mais on ne peut pas supprimer les mots vides, donc ce n'est pas le mot écriture en chinois qui apparaît le plus gros. L'export en PNG curieusement, ne donne que des carrés et il faut passer par le logiciel Paint pour l'enregistrer correctement et obtenir ceci.

Pour le japonais

Tagxedo

JaponFait un joli cœur de mots en japonais.

Wordle

Ne marche pas quand je l'utilise pour créer un nuage de mots à cause d'un problème de Java.

WordItOut

Trouve des mots anglais, voir le résultat ici.

Autres tentatives et sites pour créer des nuages de mots

J’ai essayé Tagul,Twittersheep,Quintura, Tagcrowd,Vocabcrabber, tous ces outils ne fonctionnent pas bien pour le japonais.

Seul Wordsift sait traiter les mots japonais mais le résultat n'est pas joli et ni satisfaisant. En effet, il trouve aussi les mots anglais (notamment space et goo - parce qu'il existe un dictionnaire google nommé GOO en japonais)