Nous avons utilisé plusieurs façons de créer les nuages de mots. Nous avons d’abord essayé le site Tagxedo http://www.tagxedo.com/app.html en utilisant les fichiers « dump global » comme fichier d’entrée, ensuite nous avons tenté un autre site HTML5 Word Cloud http://timdream.org/wordcloud/ en faisant entrer les fichiers « contexte global ». Le but est de voir s’il y des différences remarquables en fonction du logiciel utilisé ainsi que ficher d’entrée choisi. Le résultat montre que grosso modo, il y a plus de mots cooccurrents autour du mot-clé par « dump global » que par « contexte global », ce qui n’est pas inattendu, vue que le fichier « contexte global » ne contient que des lignes autour du mot-clé, tandis que le fichier « dump global » contient tout le contenu du texte. Pourtant, il y a aussi un défaut en utilisant « dump global », c’est que les mots qui sont en dehors du contenu du texte mais à l’intérieur du page ont tous entré en jeu.
Pour le site Tagxedo, on a modifié le fichier d’entrée en supprimant manuellement les mots grammaticaux. Un avantage de ce site est que l’on peut choisir différentes formes de nuages pour afficher les résultats… ! Pour le site HTML5 Word Cloud, on a remarqué que l’on y peut non seulement supprimer les mots non-voulus, mais aussi modifier la fréquence des mots. Nous n’avons bien sûr pas triché mais, simplement en modifiant la fréquence du mot-clé « nostalgie », on a évité qu’il s’affiche gigantesquement par rapport à ses cooccurrences au tour qui ont des fréquences beaucoup moins élevés.
D’un point de vue linguistique, les cooccurrences trouvées dans ces trois langues montrent qu’il y a des différences relativement importantes en fonction de langue en question. Par exemple, pour le français, les mots plus fréquents sont des mots comme «sentiment», « mélancolie », « temps », « pays », « passé », « négative »…, des concepts ayant des sens un peu lourd et plus métaphysique par rapport à l’anglais, où on voit des mots comme « teenage », « life », « experience », « people », « culture »..., des mots ayant un aspect plus socioculturels et plus neutres. Tandis que pour le chinois, ce sont des mots comme « 过去 » (le passé), «心理 »(psychologie), « 回忆 »(souvenir), « 城市 »(ville), « 传统 »(tradition), « 文学» (littérature) se sautent aux yeux. On remarque donc les subtiles différences de la notion « nostalgie » et des éléments culturels dans ces trois langues et ces trois cultures.