Nuages de mots

Qu’est-ce qu’un nuage de mots ? D’après notre cher ami Wikipédia, un nuage de mot "est une représentation visuelle des mots-clés les plus utilisés sur un site web" (ici, dans nos textes) et "plus un mot-clé est cité […], plus il apparaîtra en gros dans le nuage".
Afin de générer nos nuages de mots, nous avons utilisés le site https://nuagedemots.co. Nous y avons copié le texte contenu dans nos fichiers concaténés contextes et nos fichiers concaténés dump. Il est possible de supprimer manuellement les termes que l’on ne souhaite pas voir dans notre nuage.
Donc, pour le portugais, deux nuages de mots ont été crée. Pour le chinois et pour le japonais, quatre nuages de mots ont été crée. Deux pour le mot 家庭 et deux autres pour le mot 家族.

Chinois

Que ce soit dans les fichiers dump ou contextes, certains mots semblent ressortir plus que d’autres.

家庭 jiā tíng

Contextes

Dans le fichier contexte, "家庭" et la particule "的" sont plus imposants. Nous avons également des mots rappelant le lexique de la famille tels que "孩子" (enfant) et "母亲" (mère). Le mot "père" ne semble pas apparaître.
La catégorie grammaticale semblant le plus ressortir, cependant, est le verbe. Nous pouvons relever les verbes "来" (venir), "出身" (naître), "知道" (savoir), "到" (arriver), "找" (chercher),…

Dump

Dans le fichier dump, les mots qui ressortent le plus ne contiennent pas notre mot principal. La raison est que j’ai eu beaucoup de mal à trouver de textes littéraires contenant plus de deux occurrences de 家庭 ou de 家族. (comme vous pouvez le voir dans mon tableau pour le chinois)

家族 jiā zú

Contextes

Comme pour 家庭, dans le nuage des fichiers contextes, ce sont les mots "家族" et "的" qui sont le plus mis en avant. Ici, "父亲" apparaît mais "enfant" et "mère" ne sont pas présents.
Nous retrouvons certains mots de notre analyse iTrameur des fichiers dump comme "长辈" (aînés) et "黄金" qui sont les descendants directs de la dynastie mongole des Yuan (1234 - 1368) utilisé avec 家族 mais qui signifie aussi "or".
Dans le même genre historique, nous pouvons relever le mot "秦家" qui, au cours de la période des Royaumes Combattants, a réussi a annexer les 6 autres royaumes et devient la première dynastie impériale de la Chine : la dynastie Qin (221 - 206 av. J.-C). Il y a aussi "帝都" qui signifie "capitale impériale".

Dump

Dans le nuage des fichiers dump, bien que notre mot principal soit présent et qu’il n’a pas fallu faire de grand nettoyage comme pour 家庭, ce n’est pas lui qui apparaît avec la plus grande police. Comme pour les autres nuages, l’un des mots apparaissant le plus est la particule "的". Mais nous retrouvons également "陆云初" qui semble être le nom d’un des protagonistes de nos textes.
Cependant, comme dans le nuage des contextes, nous voyons "父亲" (père) et nous trouvons ici "老妈" (maman)

Japonais

家庭 Katei

Dans le nuage en contexte, les mots les plus grands sont les mêmes que ceux trouver par itrameur. On trouve au milieu du nuage le mot pivot du fichier concaténé en contexte : 家庭

  • 生活 (seikatsu) : la vie quotidienne
  • 幸福 (kôfuku) : le bien-être, heureux
  • 料理 (ryôri) : cuisine
  • 教育 (kyôiku) : éducation
  • 円満 (enman) : heureux
  • ...

Contexte

Dans la version dump, les mots vont différer de ceux trouver par itrameur car dans on s'était concentré sur les mots autour de 家庭. Ici, on s'intéresse aux textes entier. Et pourtant, 家庭 fait parti des mots les plus imposants avec la liste suivante :

  • 生活 (seikatsu) : la vie quotidienne
  • 日本 (kôfuku) : le bien-être, heureux
  • 料理 (ryôri) : cuisine
  • 家庭 (katei) : foyer
  • こころ (kokoro) : coeur
  • ...

Dump

家族 Kazoku

Contexte

Comme pour le mot précédent, les mots les plus gros sont les mêmes que ceux trouver par itrameur. On trouve au milieu du nuage le mot pivot du fichier concaténé en contexte : 家族

  • 生活 (seikatsu) : la vie quotidienne
  • 幸福 (kôfuku) : le bien-être, heureux
  • 料理 (ryôri) : cuisine
  • 教育 (kyôiku) : éducation
  • 円満 (enman) : heureux
  • ...

Dump

Les mots qui sont le plus en avant ici sont des termes liés à la famille :

  • うち/家 (uchi/ie) : maison
  • 子 (ko) : enfant
  • 父 (chichi) : père
  • 者 (mono) : membre
  • 血 (chi) : sang
  • 愛 (ai) : amour

Portugais

Família

Contextes

En plus des formes « família » et « famílias » (singulier et pluriel) très évidents, il est possible de remarquer des mots en français comme « soirée » et « toilletes» . Cependant, cela devient compréhensible lorsque nous considéronscomprenons que le contexte social et éducatif des écrivains passait par l’Europe, en particulier par la France, qui était une grande référence des intellectuels à cette époque-là.

Dump

Dans ce cas, il y a beaucoup de verbes et certains noms liés à des noms de personnages comme Maria, nom très commun en portugais. C’est probablement dû à la répétition des noms des personnages dans la narrative que ces noms sont évidents. Alors qu’aucune forme de « família » s'affiche dans le nuage des fichiers dump.