Le mot "migrant" : variations sur le web

Nuages de Mots

Les nuages de mots se font à partir de logiciels gratuits et libre d'accès sur internet. Il en existe plusieurs, mais nous nous sommes servi de WordItOut. Il suffit de donner un texte en entrée, et en sortie, un programme calcule les fréquences des mots et fait un "nuage" avec les mots les plus fréquents du texte : plus le mot est gros (visible), plus sa fréquence est importante. Nous sommes bien sûr libres de choisir les couleurs, la disposition du nuage, la taille des mots selon leur fréquence, etc.

Ces nuages de mots sont très intéressants, car ils mettent en lumière les mots les plus fréquents que nous retrouvons autour du mot "migrant". Nous avons généré 3 nuages par langue à partir de nos contextes globaux : un pour chaque thème, à savoir discours politiques, journalistiques et quotidiens. Voyons ce que cela donne...

Nuages d'anglais

Concernant l'anglais, le logiciel traite cette langue par défaut, et propose, dans la rubrique "text", une série de mots grammaticaux anglais à ignorer. Cela élimine les mots très fréquents qui seraient inintéressants.

Discours politiques

Nuages de mots anglais : discours politiques

Discours journalistiques

Nuages de mots anglais : discours journalistiques

Discours quotidiens

Nuages de mots anglais : discours quotidiens


Le premier mot qui ressort dans les nuages est bien "migrants", au pluriel. Le second est "migrant" au singulier. Nous pouvons observer que les mots cooccurrents avec "migrant" concernent les points importants de la question de migration en Grande Bretagne: workers, EU, UK, illegal, services, access, suivi de NHS (National Health Service), contribution, economic, new, health, access et rights.


Il faut aussi remarquer que le mot "illegal" a une fréquence plus importante dans les textes tirés des sites gouvernementaux et officiels, y compris dans les paroles de membres du parlement, ainsi que du Premier Ministre. De plus, health est aussi assez fréquent par rapport aux textes de la presse et des blogs.
Mais globalement, les nuages sont assez semblables à première vue.

Nuages de français

Pour les nuages de mots français, la fréquence du mot "migrants" ressort bien, loin devant celle des autres mots. Nous remarquons que les occurrences trouvées ne proposent que le terme au pluriel, contrairement à l'anglais où nous trouvons aussi les mot au singulier. Il semble que ce terme soit toujours utilisé pour parler d'un ensemble, mais jamais, ou très rarement, de cas particuliers, contrairement à l'anglais où nous trouvions bien "migrant" au singulier. Nous notons une légère différence dans le nuage qui concerne les blogs.
Nous remarquons un fait très important : les fréquences de mots des corpus français sont beaucoup moins importantes que celles des autres langues. En effet, le mot "migrant" n'est pas utilisé si souvent par les locuteurs de la langue française.

Dans les réglages, nous avons du préciser un nombre de 5 lettres minimum afin d'éviter les mots grammaticaux tels que "le, la, de, avec, etc". Nous nous sommes limitées à 85 mots les plus fréquents par nuage afin que l'ensemble reste lisible.

Discours politiques

Nuage de mots français : discours politiques

Discours journalistiques

Nuage de mots français : discours journalistiques

Discours quotidiens

Nuage de mots français : discours quotidiens


Dans les discours politiques, nous rencontrons des termes attendus dans un discours politique tels que "projet", "travailleurs" ou "développement". Les cooccurrents "illégaux", "intégration", clandestins, ont une fréquence moindre. Nous remarquons un équilibre entre les fréquences relevées, sans doute du au travail très recherché sur la conception des discours politiques.


Pour les corpus provenant de la presse, les cooccurrents les plus fréquents sont "droits", "réfugiés" "Calais" et "Lybie", ces derniers faisant partie de l'actualité au moment de notre recherche de corpus. Nous retrouvons "personnes" et "travailleurs, également présents dans les corpus politiques. En revanche, nous lisons "survivants", "morts", ou encore "squats", termes que nous ne trouvons pas dans les discours politiques.


Concernant le langage quotidien, nous remarquons une différence visuelle. Les fréquences sont plus hétérogènes, et les mots qui apparaissent sont différents des deux autres corpus. Il est très intéressant de remarquer que les premiers cooccurrents de "migrants" sont "parents", "jeunes", et "délinquance". Nous rencontrons les synonymes "clandestins", et "émigrants". Ses termes montrent une prise de position de la part des locuteurs. Cela n'est pas surprenant de la part de corpus provenant de forums ou de blogs, puisque c'est là où les citoyens s'expriment librement.


Pour conclure, nous voyons que les nuages de la presse et des discours politiques sont assez semblables, mais que celui du langage des citoyens nous montre des fréquences plus hétérogènes, et différentes des deux corpus précédents. Les fréquences relevées sont nettement moins élevées que pour les autres langues étudiées, ce qui montre que le mot "migrant" en français est moins utilisé par les locuteurs, laissant peut-être la place à ses synonymes.

Nuages de russe

Discours politiques

Nuage de mots russe : discours politiques

Discours journalistiques

Nuage de mots russe : discours journalistiques

Discours quotidiens

Nuage de mots russe : discours quotidiens


Nous avons relevé deux poins communs aux trois corpus :
Tout d'abord, les mots migranty "des migrants" , migrantov (= génitif) font partie des mots les plus fréquents dans nos trois corpus.
Ensuite, nous voyons que quelques autres mots en relation avec notre mot d’étude apparaissent dans les trois corpus mais n’arrivent pas en première position : "migration, immigration (migracii, immigracii, migraciya, immigraciya, migraciej) ; migratoire(s) (migracionnaya, migracionnogo, migracionnoj, migracionnyh, migracionnyj, migracionnye) ; illégal(e) (nelegal’noj, nelegal)".


Nous avons noté quelques différences en fonction des corpus observés.
Sur les blogs et forums russes, le mots le plus fréquent du corpus est le mot "migrants" (migranty, migrantov, migrantam, migrantami). Les mots qui suivent sont : "immigration(immigracii); illégal (nelegal); migratoire (migracionnoj); actifs (trudovyh)".
Quelques autres mots présents au sein du corpus montrent une attitude négative des citoyens russes envers l’immigration. Ce sont les mots tels que : "meurtre (ubijstvo); crimes(prestuplenija); concurrents (konkurenty); problèmes(problemy); viol (izvasilovanie)".


Pour la presse russe, les mots (im)migrants (migranty, migrantov, immigrantov); (im)migration (migracii, migraciya, immigracii); migratoire (migracionnaya) et illégal(e) (nelegal’noj) sont les plus fréquents au sein de ce corpus. Les mots Russie (Rossii), étrangers(inostrannyh), intégration (integracii) ressortent également, avec une fréquence moins importante.


Dans les discours politiques, les mots les plus fréquents du corpus sont : "migrants (migrantov, migranty, migrantam); (im)migration (migracii, immigracii); migratoire (migracionnoj); politique (politiki); illégal (nelegal’noj)".


Pour conclure, nous avons remarqué que les mots cooccurrents avec le mot "migrant" concernent les points importants dans la question de migration en Russie : travail, droit, politique, législation, intégration, criminalité. Les termes utilisés au sein des corpus pour désigner les migrants sont : migranty (migrants), priezzhie (arrivants), inostrancy (étrangers), gastarbatery (travailleurs immigrés).

Master Ingénierie Linguistique - Nuages de mots