Analyse du corpus

Corpus français

L’hypothèse initialement formulée était que l’immigration serait considérée comme problématique, voire qu’elle soit négativement connotée. Les URLs choisies sont issues de pays francophones considérés comme des terres d’accueil, à savoir la France, le Canada, le Luxembourg et la Suisse.

Effectivement, des mots tels que “débat”, “préoccupation”, “offensive”, “débattue” etc., suggèrent qu’il existe une polémique autour du phénomène migratoire, que ce dernier préoccupe. L’on trouve également des termes tels que “masse”, “limite”, “limitation”, ce qui suggère qu’il s’agit d’un phénomène indésirable, perçu comme encombrant.

L’apparition courante des noms des pays concernés semble normale, puisqu’il s’agit d’articles de journaux issus de ces mêmes pays.



Corpus chinois

Le corpus chinois est constitué de trois origines différentes : les sites administratifs officiels des pays d’accueil, les reportages chinois et les reportages étrangers traduits en chinois. Il y a donc trois perspectives concernant le motif « immigration »: les gouvernements, le journalisme chinois et le journalisme international.

L’hypothèse initiale sur le corpus chinois serait que le mot “immigration” engendre une mélange des idées positives et négatives, dont les opinions pessimistes tiennent une moins grande partie.

Selon le nuage de mots et les graphes de cooccurrents, la plupart des mots sont neutres voire mélioratifs comme: « 留学 » (étudier à l’étranger), « 技术 » (technologie), « 人才 » (talents), « 吸引 » (attraction), « 乐观 » (optimisme), etc. En même temps, on peut aussi trouver des énoncés plus péjoratifs, comme « 非法 » (illégal), « 问题 » (problème), etc. Il est dur de juger de la valeur de certains mots (positive ou négative) indépendamment de leur contexte, comme: « 居留 » (séjour), « 投资 » (investissement), « 经济 » (économie), « 社会 » (société), etc.

Les avantages et les inconvénients de l’immigration sont tous les deux présentés dans le corpus chinois. En général, l’on reste dans une perspective neutre ou relativement optimiste sur le sujet de l’« immigration ». Pourtant, certains doutes et problèmes potentiels transparaissent tout de même.



Corpus arabe

Notre hypothèse initiale quant à l'arabe était que le focus serait mis sur l'effort d'émigration, sachant que les URLs sont majoritairement tirées de pays touchés par le phénomène d'émigration. Bien que récemment, ces pays puissent connaître une certaine vague d'immigration, culturellement la notion d'émigration y resterait encore très ancrée. Il est peut-être pertinent de noter, qu'en arabe, les mots "émigration" et "immigration" sont désignés par le même terme.

L’hypothèse semble justifiée, sachant que parmi les mots clés ressortant le plus souvent, l’on retrouve des mots tels que “légalité”, “programme”, “Europe”, “Canada”, “ministère”, “contraintes”. L’on y décèle donc la mise en place d’une procédure d’émigration, ainsi que les noms des terres d’accueil. La perspective semble neutre, l’on n’y décèle pas de connotation négative particulière. Le mot “rêve” apparaît également sur les schémas de coocurrents, ce qui apporte une note clairement positive, suggérant qu’il peut s’agir d’un phénomène désirable.

Le mot “Egypte” apparaît également à maintes reprises, mais sachant que la plupart des URLs sont tirées de journaux égyptiens, cela est sûrement normal.



Corpus espagnol

L’hypothèse formulée à propos de l’espagnol était que le mot “immigration” aurait une connotation négative, reliée à la violence souvent attribuée au phénomène migratoire en Amérique Centrale.

Dans le nuage de mots en espagnol, on a pu constater que les mots qui accompagnaient le mot “inmigracion” étaient majoritairement des mots faisant référence à des noms de pays, tels que le Chili et la Croatie, l’on ne trouve toutefois pas de noms de pays d’Amérique Centrale.

De plus, la profession d’ouvrier était souvent mentionnée, ainsi que des mots-clés tels que ” salaire”, “gouvernement”, “emploi”, “politiciens”, “fuite”, “marché”, “développement”, “de masse”( en faisant référence à l’immigration). Ces mots étaient anticipés par notre hypothèse initiale. L’on trouve aussi par exemple, ” 96x mil”, ce qui fait référence au taux d’immigrés.



Conclusion

Ce projet nous a permis de tester les hypothèses initialement formulées, malgré un corpus limité ( 50 URLs pour chaque langue ). Nous avons choisi des URLs provenant de différents pays, pour chaque langue, en vue d’élargir le contexte social et politique étudié.

La connotation attribuée à l’immigration, est largement négative, tournant autour des inconvénients de cette dernière, le fait qu’elle fasse débat, son illégalité etc… Cependant, nous retrouvons des connotations plus neutres, voire positives, notamment dans le corpus arabe et le corpus chinois, où l’on parle d’opportunité d’émigration pour pouvoir effectuer des études plus prestigieuses par exemple. C’est notamment le cas de l’arabe, où l’on retrouve le mot “rêve”. Il faudrait également noter que les mot “immigration” et “émigration” sont désignés par le même terme, dans le cas de ces deux dernières langues.

Ce projet nous a servi d'initiation à l’analyse automatique des données linguistiques, et nous a permis de nous familiariser à un environnement de programmation.