Nos difficultés

Notre étude consistait à analyser le comportement sur le Web du mot “diplôme” sur Internet, en français, en chinois et en coréen. Nous avions choisi de rajouter une difficulté supplémentaire en ne sélectionnant que des URL provenant de forums, blogs, réseaux sociaux ou autre type de contenu écrit sans filtre, directement par les utilisateurs. Ayant besoin de minimum 50 URL par langue, nous nous attendions à avoir du mal à les trouver en français, mais à en trouver à profusion en chinois et en coréen, car les populations de ces pays sont très axées sur l’informatique et utilisent beaucoup les forums.

Cette contrainte nous a malheureusement posé beaucoup de problèmes. Alice n’a eu aucun mal à trouver plus de 400 URL correspondant à nos critères en chinois, mais Laurine n’en a trouvé qu’une quarantaine en coréen, dont beaucoup n’étaient finalement pas utilisables. He a également trouvé peu d’URL respectant cette contrainte en français. Cette première difficulté nous a fait perdre énormément de temps, et nous avons finalement décidé d’élargir nos critères, en éliminant seulement les sites officiels, de gouvernements ou d’établissements scolaires. C’est ainsi que nous avons récupéré des articles de presse en français et en coréen, mais pas en chinois. Cela pose donc déjà un problème d’homogénéité dans nos corpus, qui ne sont plus vraiment comparables entre eux. Nous avons tout de même décidé de continuer sur cette voie, en sachant que le résultat de l’analyse ne serait pas entièrement fiable.

Cette difficulté nous a cependant fait prendre du retard sur le projet, et nous avons dû nous contenter de 56 URL en français et 107 en coréen, pour 461 en chinois. Une fois de plus, cela rendait notre corpus un peu plus hétérogène. Nous avons donc décidé de réduire la quantité d’URL et de n’en garder qu'une cinquantaine dans chaque langue, ce qui permettait également de faciliter l’exécution du script, qui prenait énormément de temps, notamment à cause des segmenteurs pour le coréen et le chinois. Nous avons envisagé de faire la même étude deux fois pour le chinois, pour comparer les résultats avec les 400 URL et avec une cinquantaine d’URL. Nous trouvions intéressant de voir si un vrai échantillon et un zoom sur une partie allaient se recouper ou non. Nous avons cependant manqué de temps et n’avons pas pu mener cette idée jusqu’au bout, nous contentant de l’analyse des 50 URL, comme pour les autres langues.

Nous avons également eu des difficultés avec le script, notamment à cause du fait que nous utilisons chacune un système d’exploitation différent (Windows, MacOS, Ubuntu). Nous avons fini par utiliser un script qui fonctionne seulement sur Windows et Ubuntu.


Les points positifs

Malgré les obstacles rencontrés, nous avons également beaucoup appris grâce à ce projet. Les difficultés concernant le script nous ont poussées à nous documenter en ligne, plus particulièrement sur des forums (StackOverflow, etc.). Etant novices dans le domaine de la programmation, nous avons ainsi pu apprendre beaucoup de choses sur l'utilisation de commandes Bash telles que curl et lynx, notamment sur les problèmes d’encodage, ainsi que sed et grep. Afin de tester nos commandes, nous avons dû faire des petits scripts en Bash, par exemple pour compter le nombre de pages vides ou le nombre de fichiers mal encodés. Ces recherches que nous avons dû mener par nos propres moyens nous ont amenées à réfléchir : comment avoir recours à telle commande, à tel outil, et ainsi à comprendre la logique de la programmation. De la même manière, nous avons appris à utiliser le terminal et à être à l’aise avec l’utilisation courante de cet outil dont certaines d’entre nous ne connaissaient rien au début du Master. Nous avons également découvert l’HTML ainsi que tout l’envers du décor d’un site, dont nous ne connaissions que les grandes lignes.


Nous avons également appris beaucoup grâce à l’aspect multilingue de ce projet. Bien que nous soyons chacunes chargées d’étudier une langue, nous avons échangé et partagé nos informations. Ainsi, chacune d’entre nous a pu découvrir le fonctionnement des autres langues qu’elle ne connaissait pas. Nous avons aussi pu approfondir nos connaissances concernant nos propres langues, puisque nous avons choisi d’étudier des langues n’étant pas nos langues maternelles. Ce projet nous a également permis de développer notre culture des pays étudiés, grâce aux résultats de notre analyse, qui, rappelons-le, ne doit pas être prise trop au sérieux du fait de ses nombreuses imperfections.


Ce projet étant mené en groupe, nous avons également pu améliorer des compétences telles que l’esprit d’équipe et la collaboration. Nous avions chacune une langue à étudier, mais menions la même études, il était donc impossible de mener ce projet à bien sans un vrai travail d’équipe. Nous nous sommes beaucoup entraidées, notamment pendant la phase de création du script.


Analyse

Les résultats de l’étude de chacune de nos trois langues sont disponibles ci-dessous. Toutes nos analyses obtiennent à peu près le même résultat : les internautes s’inquiètent de leur avenir et se posent beaucoup de questions au sujet de leurs études et des diplômes nécessaires. Que faire si on n’a pas de diplôme ? Peut-on trouver un travail sans diplôme ? Est-il vraiment nécessaire d’en avoir un ? Est-il préférable d’en avoir plusieurs ? Ces questions sont récurrentes dans nos trois langues. On peut cependant observer que les coréens et les chinois semblent vouloir fuir une situation en trouvant d’autres moyens de parvenir au même résultat, que ce soit en étudiant à l’étranger, en suivant une formation en ligne, ou même dans certains cas en achetant ou en fabriquant un faux diplôme. Les français, quant à eux, semblent chercher des moyens moins extrêmes, mais expriment plutôt leur anxiété liée à la réussite des études, dont les conséquences semblent identiques.


Pour le français, lorsqu’on a sélectionné les urls dans des forums ou des blogs comme le corpus à rechercher par la suite. Dans un premier temps, à l'aide de Google Chrome, on a réussi à relever certaines des urls, cependant, on a rapidement constaté que les résultats n'étaient pas aussi bons que nous l'espérions, car la culture des forums en France n'est pas aussi développée qu'elle pourrait l'être. Puis on a essayé de passer à nouveau à Yahoo, de sorte que le corpus français provenait de la quasi-totalité des résultats présentés par ces deux grands sites de recherche. Aujourd'hui, bien que d'autres grands sites de réseaux sociaux tels que Twitter ou Facebook puissent nous aider dans notre démarche de collecte, on essaie d'éviter ces applications populaires, dans l'espoir de rendre notre échantillonnage plus universel plutôt que de nous appuyer uniquement sur les voix véhiculées par les grands médias.
Ayant traité le script pour en extraire le corpus, il était sans surprise que les diplômes étaient les mots les plus fréquents dans le texte. Quant aux autres termes relativement fréquents, notamment « sans », « double », « obtenir », « réussir », « reconnu », « reconnaître », « authenticité», « faux », lorsqu'ils sont associés au mot diplôme, il ne fait aucun doute qu'ils reflètent certaines questions sociales qui nous concernent. En fait, comment obtenir un diplôme, que faire si vous n'en avez pas, et est-il nécessaire d'obtenir un double diplôme, la certification des diplômes, les faux diplômes sont quelques-uns des problèmes les plus fréquemment abordés dans les forums autour du mot diplôme. Dans ce contexte, l'anxiété des jeunes Français face à leurs études se traduit très clairement par ce phénomène. Autant de personnes échouent dans leurs études mais font tout pour faire semblant afin d'obtenir un meilleur emploi pour s'intégrer dans la société. On a appris que la Chine avait le même problème. Ce corpus ne reflète qu'un seul aspect du système éducatif français, mais nous soulevons ici la question de manière plus profonde, l'inadéquation du système éducatif, qui fait souvent peser sur les étudiants le poids de ne pas terminer leurs études à temps, ainsi que la pression de la concurrence pour les emplois qui ne peut être ignorée dans l'ensemble de la société.


Pour le coréen, nous avons cherché deux mots dans notre motif : 졸업장 et 졸업 증서. Ce deuxième mot ne donnant malheureusement que très peu de résultats dans nos recherches d’URL, nous l’avons inclus dans le motif du script et dans le tableau, mais nous l’avons laissé de côté pour la suite de l’analyse textométrique, car le peu de données recueillies n’était pas pertinent pour notre étude.
Les résultats du tableau sont très intéressants, notamment les index, les bigrammes, ainsi que les trigrammes, que nous avions ajoutés à cause des particules du coréen. Ces particules restent cependant très présentes dans les trois fichiers, et nous avons dû nous contenter d’effectuer nos analyses sans les prendre en compte.
La majorité des mots les plus utilisés dans notre corpus appartiennent au champ lexical de la scolarité, plus exactement du lycée mais surtout de l’université et du diplôme, comme on pouvait s’y attendre, avec 졸업장 (diplôme) comme mot le plus fréquent. On retrouve également dans une fréquence moins élevée le champ lexical de l’emploi et de l’avenir.Notre corpus traite également brièvement de sujets un peu moins conventionnels, comme des diplômes obtenus tardivement par des personnes âgées, ainsi que d’autres types de diplômes, en ligne ou à l’étranger.
On trouve cependant beaucoup de termes démontrant une remise en question, comme 생각 (pensée), 선택 (choix), 방법 (méthode) ou encore 생활 (mode de vie). Les internautes ont tendance à questionner leurs propres choix de vie, mais également le système éducatif sud-coréen, qui est très exigeant. Certains envisagent d’abandonner leurs études, comme le laissent penser les mots 필요할까 (a-t-on vraiment besoin), 없으면 (si je n’ai pas), 필요없다고 (ne pas avoir besoin) et 그만한 (arrêter). Suite logique de ces abandons et remises en question, le thème des faux diplômes apparaît également dans notre corpus. Le niveau d’exigence du système éducatif est une vraie réalité en Corée du Sud, et cette pression sociale peut mener à tout faire pour réussir, car le diplôme reste un indispensable pour être parfaitement intégré dans la société, et peu d’entreprises acceptent de recruter quelqu’un en se basant seulement sur ses compétences. Il est donc inévitable que certaines personnes cherchent à obtenir un diplôme par tous les moyens possibles, que ce soit en allant à l’étranger, en suivant une formation en ligne, ou même en achetant un faux diplôme. Ces conséquences sont visibles uniquement dans des textes informels, où tout le monde peut s’exprimer librement et de manière spontanée, tout en restant anonyme, car ces personnes ne sont pas fières d’avoir “échoué” à suivre le système traditionnel et de devoir utiliser des moyens “détournés” pour s’adapter aux attentes de la société.
Nous devons cependant garder en tête que cette analyse ne reflète pas entièrement le société coréenne, car elle ne se base que sur une partie de ce qu’on peut trouver sur Internet, qui ne représente pas non plus la pensée de toute la population.