• +00 (33) 06 32 06 35 10
  • xyxflorent@gmail.com

__

NUAGE DE MOTS

__

ANALYSE DU CORPUS VIETNAMIEN PAR ITRAMEUR

1.Pré-traitement: préparer le corpus

Créer 2 corpus (deux fichiers) : l'un va contenir tous les fichiers CONTEXTES et l'autre va contenir tous les fichiers DUMPS.

Pour le faire, j'insère dans mon script un petit script qui sert à regrouper tous les fichiers DUMP et CONTEXTES dans les deux fichiers qui s'appellent CONTEXTES-GLOBAUX et DUMP-GLOBAUX. En plus, dans chaque fichier global, ce script va mettre des balises pour bien séparer les fichiers entre eux.

Résultat du script

2. Morphologie vietnamienne

Comme le Vietnamien est une langue isolante et monosyllabique, elle n’a pas de flexion. En fait, un mot vietnamien est composé d’une ou plusieurs syllabes, d’un ou plusieurs morphèmes. Le tableau ci-dessous (Wikipedia) va nous donner une distinction générale entre « mot » « syllabe » et « morphème » (le plus petit élément significatif)

WIKIPEDIA

Revenant sur notre cas, le mot « individualisme ». Dans la langue vietnamienne, ce mot se traduit par un mot composé, formé à partir deux noms différents "chủ nghĩa"et "cá nhân". "Chủ nghĩa" équivaut au suffixe "-isme" et "cá nhân" équivaut au nom "individu".Mais plus précisément, ce mot est composé de quatre morphèmes, c’est-à-dire « chủ », « nghĩa », « cá », « nhân » ont doté de leur propre sens. Et cela nous pose un problème dans l’analyse.iTrameur n'analyse pas ce mot comme un seul mot mais il va analyser comme les quatres mots différents.

3.Analyser avec iTrameur

Alors, pour régler ce problème, on a remplacé tous les mots « chủ nghĩa cá nhân » par le mot « individualisme »

A l’aide de Itrameur, on peut consulter les co-coccurrents, les mots les plus fréquents par rapport à notre motif « individualisme ». Dans le dictionnaire obtenu par iTrameur, la fréquence du mot « individualisme » est 765.

img src="images/demo/backgrounds/ana_6.png"/>

Les mots les plus fréquents autour de ce mot sont : « là » (est) , « chống » (lutter contre), « Ho Chi Minh », « cách mạng » (révolution), « thù », « địch » (ennemi)


Comme en Chine, au Vietnam, le mot 'individualisme' porte aussi un sens péjoritif dans le domaine politique. On va trouver régulièrement, dans des journaux, les expressions comme: lutter contre, s'opposer à, prévenir l'individualisme ou "l'individualisme" est considéré comme un style de vie égoïste, une maladie. Mais pourquoi ce mot a-t-il un sens négatif au Vietnam? En fait, au Vietnam, ce mot est lié à Ho Chi Minh, le fondateur de la République Démocratique du Vietnam. Et selon son idéologie, "l'individualisme" est un ennemi qui va menacer le développement d'un pays en général ou d'un individu en particulier. Alors, dans les presses vietnamiennes, le mot "individualisme" va s'associer toujours à des mots "lutter contre" (chống), "ennemi" (thù, địch).


En plus, comme ce mot est lié au domaine politique, les presses ne vont pas en parler beaucoup en détail. Autrement dit, elles ne vont pas donner leurs pensées, leurs opinions, leurs avis portant sur ce mot mais elles vont aborder les informations qui sont plutôt neutres. Alors, dans presque tous les journaux, on peut trouver le même contenu, il s’agit de la définition du mot « individualisme » selon l’idéologie de Ho Chi Minh. C’est la raison pour laquelle le mot « là » (est) est le co-cooccurent le plus fréquent du mot « individualisme »