Conclusion :
Notre projet était donc d'étudier le mot 'génération y' dans des corpus journalistiques français, anglais, et allemand.
Notre premier choix à été de ne pas prendre en compte les urls que nous
considérions comme problématiques, c'est-à-dire comme la rédaction
d'article en Chine ou en Inde en anglais, nous nous sommes limités à
l'amérique du nord. Et comme nous l'avions pensé, les différences sont
minimes du fait de la culture occidentales.
Mais avant de revenir sur les conclusions linguistiques, un petit retour
sur le programme bash s'impose. Celui-ci nous a permis de constituer un
corpus, à partir d'URLs, d'une taille relativement grande, de manière
très rapide, et d'en sortir des informations, encore une fois de manière
très rapide. Ce qui en fait un bon outil pour accéder aux informations
dont nous avons besoin. Après avoir aspiré les pages et fait les dumps,
nous avons extrait le motif, son contexte et fait un index dessus
montrant très clairement les différentes appelations de la "génération
y". Si en France et en Allemagne le terme "génération y" reste le plus
utilisé, en amérique du nord, nous trouvons aussi 'millenials' et
'digital natives' ou 'gen y' très souvent. Si le dernier n'est surement
qu'a considéré comme une contraction de "génération y", les deux autres
sont interressants car ils nous montrent que cette génération est
souvent appelée par les caractéristiques que l'on lui colle, par
lesquelles elle est décrite, et non pas seulement de manière neutre par
"génération y".
Les nuages de mots nous montrent de manière plutôt esthétique les mots
qui se trouvent le plus souvent dans le contexte de "génération y". Par
exemple, dans le nuage de mots sur les dumps allemands, après
"Generation Y", nous avons "Generation" et "Unternehmen"("Entreprise"),
les deux pratiquement à la même taille, alors quand dans ceux sur la
langue anglaise, les mots "work" et "job" sont présents, prédominants
aussi, mais à un police plus petite, mélés tout de même au reste. Si la
question de l'insertion de la génération y dans le monde du travail
reste un sujet présent chez tout les journalistes, il semblerait qu'il
soit le plus important pour les journalistes allemands et mélé à
d'autres pour les américains.
Mais tout cela reste vague avec les nuages de mots. La prise en compte
ou non des "mots vides" n'est pas adaptable, ce qui fait de cette outil
qu'il est n'est pas plus opératoire que ce dont on a pu en dire. Le
trameur quant à lui, nous permet d'accéder à plus d'informations, et
celle-ci sont bien plus exploitables du fait de leur précision. C'est un
logiciel de textométrie sur windows. L'objectif de ce logiciel est de
compter des éléments dans un texte, il permet grâce à différentes
fonctions d'analyser un corpus. Tout d'abord, quand on charge une
nouvelle base il commencer par la paramétrer c'est à dire définir
l'encodage du texte importé , choisir la langue, ... Une fois les
paramètres définies, on peut analyser le texte.
Dans le cadre de notre projet on s'est focalisé sur la recherche des
co-occurents de notre thème "la génération Y". les co-occurents étant
les mots qui viennent souvent autour du mot choisi.
Le premier problème qui s'est posé est de définir le contexte pour la
recherchedes co-occurents. Pour définir les contextes nous avons modifié
les dumps et les contextes globaux et nous avons ajouté des
délimiteurs. Dans l'onglet "cooc" on recherche le terme "génération Y"
ou un de ses synonymes.
Le second problème a été de déterminer le nombre de co-freq et un seuil
qui varie selon la langue et le terme choisi. Le résultat obtenu grâce
au trameur nous a permis de tirer des conclusions
et de voir à quoi "génération Y" était associé, et cela semblait
différer des nuages. Enfin en tout cas, on peut cerner des nuances avec
le trameur que l'on ne voit pas avec les nuages. Comme nous l'avons dit
dans la partie sur l'analyse linguistique, on perçoit un thème plus que
redondant dans le corpus allemand qu'est le travail, et en anglais,
certains adjectifs négatifs sont utilisés pour caractériser la
génération Y.
Nous pouvons donc conclure que dans notre corpus, des nuances sont
apparues entre les différentes langues et les différents pays, même si
globalement, les préoccupations restent les mêmes, ce qui était
prévisible.