La vie multilingue de mot champagne
Conclusions
Nous avons pu voir que les analyses effectuées sur le logiciel de textométrie itrameur ont permis un regard plus poussé sur les contextes et les cooccurrents du mot champagne. Cependant, les résultats obtenus sont globalement insatisfaisants : dans aucune de nos trois langues nous n'avons pu trouver de termes (parmi les cooccurrents) dénotant une vision particulière du champagne. Or c'était là l'objectif de notre projet, confronter les différents points de vue à travers les langues sur le thème champagne. Pourtant, les termes les plus fréquemment associés à « champagne » sont souvent relatifs uniquement à la manière de le consommer (comment le boire, comment le servir). Seules quelques légères différences peuvent être constatées. En anglais, on s'intéresse également à la manière dont le champagne est fabriqué (marché du champagne, maison de champagne) et aux accidents potentiels de « bouchons volants » (« fast-flying corks »). En russe, on parle tout de même beaucoup de la marque russe de champagne, il y a donc un intérêt peut-être plus prononcé pour le « vrai » champagne. La partie française du corpus ne présente aucune particularité.

Nous supposons que ces résultats peu concluants sont dus à plusieurs raisons. Tout d'abord, notre problématique était peut-être trop large ou en tout cas pas assez adaptée à notre corpus : celui-ci étant finalement relativement réduit, il était difficile de dégager des tendances sur la manière dont le champagne est vu dans nos trois langues. Nous avions collecté chacune au départ un peu plus de 50 URLs, ce qui n'est déjà pas très grand, mais lors de l'aspiration des pages web, tout ne s'est pas forcément bien déroulé, comme nous l'avons brièvement expliqué dans l'onglet « Tableaux » de ce site. Un autre inconvénient auquel nous n'avons pensé que trop tard est la qualité des données récoltées. En effet, notre corpus issu du web n'était pas assez 'propre' : il comportait de nombreuses données qui ont pu fausser les résultats (textes identiques apparaissant à plusieurs reprises, résidus de mise en forme des sites web etc.). Sur un corpus de la taille du notre, ce genre de données a plus de chance d'influencer les résultats.

Enfin nous avions choisi un mot qui présente deux sens, l'un la boisson, l'autre la région Champagne-Ardenne. Malgré tous nos efforts pour collecter de façon pertinente les URLs, les occurrences "Champagne" et "champagne" étaient souvent mélangées ensemble dans les données textuelles.

Néanmoins, malgré les difficultés rencontrées, ce fut une expérience intéressante qui nous a mis dans une situation courante pour tout linguiste-programmeur : l'extraction de données textuelles et la gestion de ces données sur sa machine.

Nous remercions nos professeurs encadrants, Serge Fleury, Jean-Michel Daube et Rachid Belmouhoub (qui fut présent aux premières séances) pour tous leurs conseils ainsi que leur aide qui fut judicieuse tout au long de ce projet.

Made on
Tilda