Projet Master TAL

Les nuages de mots

Afin de créer les nuages de mots, il nous fallait concaténer les fichiers dump et les fichiers texte des contextes où apparaît les mots clefs. A partir de ces concaténations, on voit le contraste entre les nuages de mots du contexte et ceux qui regroupe tous les mots de la page Web.

Grâce à des solutions proposées sur internet, comme par exemple ici avec Wordle, il est possible de représenter la fréquence de certains mots dans les contextes proches de nos mots-cibles. Plus les mots ressortent dans les nuages, plus leur fréquence d'apparition est importante. Un coup d'oeil rapide permet donc de se faire une première idée d'ensemble.

Nuages du français :

Nuages de l'arabe :