Conclusion :

Notre projet était donc d'étudier le mot 'génération y' dans des corpus journalistiques français, anglais, et allemand.

Notre premier choix à été de ne pas prendre en compte les urls que nous considérions comme problématiques, c'est-à-dire comme la rédaction d'article en Chine ou en Inde en anglais, nous nous sommes limités à l'amérique du nord. Et comme nous l'avions pensé, les différences sont minimes du fait de la culture occidentales.

Mais avant de revenir sur les conclusions linguistiques, un petit retour sur le programme bash s'impose. Celui-ci nous a permis de constituer un corpus, à partir d'URLs, d'une taille relativement grande, de manière très rapide, et d'en sortir des informations, encore une fois de manière très rapide. Ce qui en fait un bon outil pour accéder aux informations dont nous avons besoin. Après avoir aspiré les pages et fait les dumps, nous avons extrait le motif, son contexte et fait un index dessus montrant très clairement les différentes appelations de la "génération y". Si en France et en Allemagne le terme "génération y" reste le plus utilisé, en amérique du nord, nous trouvons aussi 'millenials' et 'digital natives' ou 'gen y' très souvent. Si le dernier n'est surement qu'a considéré comme une contraction de "génération y", les deux autres sont interressants car ils nous montrent que cette génération est souvent appelée par les caractéristiques que l'on lui colle, par lesquelles elle est décrite, et non pas seulement de manière neutre par "génération y".

Les nuages de mots nous montrent de manière plutôt esthétique les mots qui se trouvent le plus souvent dans le contexte de "génération y". Par exemple, dans le nuage de mots sur les dumps allemands, après "Generation Y", nous avons "Generation" et "Unternehmen"("Entreprise"), les deux pratiquement à la même taille, alors quand dans ceux sur la langue anglaise, les mots "work" et "job" sont présents, prédominants aussi, mais à un police plus petite, mélés tout de même au reste. Si la question de l'insertion de la génération y dans le monde du travail reste un sujet présent chez tout les journalistes, il semblerait qu'il soit le plus important pour les journalistes allemands et mélé à d'autres pour les américains.

Mais tout cela reste vague avec les nuages de mots. La prise en compte ou non des "mots vides" n'est pas adaptable, ce qui fait de cette outil qu'il est n'est pas plus opératoire que ce dont on a pu en dire. Le trameur quant à lui, nous permet d'accéder à plus d'informations, et celle-ci sont bien plus exploitables du fait de leur précision. C'est un logiciel de textométrie sur windows. L'objectif de ce logiciel est de compter des éléments dans un texte, il permet grâce à différentes fonctions d'analyser un corpus. Tout d'abord, quand on charge une nouvelle base il commencer par la paramétrer c'est à dire définir l'encodage du texte importé , choisir la langue, ... Une fois les paramètres définies, on peut analyser le texte.
Dans le cadre de notre projet on s'est focalisé sur la recherche des co-occurents de notre thème "la génération Y". les co-occurents étant les mots qui viennent souvent autour du mot choisi.
Le premier problème qui s'est posé est de définir le contexte pour la recherchedes co-occurents. Pour définir les contextes nous avons modifié les dumps et les contextes globaux et nous avons ajouté des délimiteurs. Dans l'onglet "cooc" on recherche le terme "génération Y" ou un de ses synonymes.
Le second problème a été de déterminer le nombre de co-freq et un seuil qui varie selon la langue et le terme choisi. Le résultat obtenu grâce au trameur nous a permis de tirer des conclusions et de voir à quoi "génération Y" était associé, et cela semblait différer des nuages. Enfin en tout cas, on peut cerner des nuances avec le trameur que l'on ne voit pas avec les nuages. Comme nous l'avons dit dans la partie sur l'analyse linguistique, on perçoit un thème plus que redondant dans le corpus allemand qu'est le travail, et en anglais, certains adjectifs négatifs sont utilisés pour caractériser la génération Y.
Nous pouvons donc conclure que dans notre corpus, des nuances sont apparues entre les différentes langues et les différents pays, même si globalement, les préoccupations restent les mêmes, ce qui était prévisible.