L'alcool en quelques langues

L’alcool, ou plus précisément les boissons alcoolisées, est très présent dans nos sociétés contemporaines. Tantôt image du divertissement ou de la convivialité, tantôt de troubles psychologiques et problèmes pathologiques, la représentation de l’alcool est multiple et contradictoire au sein des médias.

Autrement que son image véhiculée, a-t-on une idée de la perception de l’alcool par ses consommateurs ? Ces perceptions et représentations s’uniformisent-elles à travers le monde ?

Nous proposons sur ce site de répondre partiellement à ces questions via une analyse lexicale tirée de données textuelles du web francophone, anglophone et japonophone.

LES STEREOTYPES DE L'ALCOOL EN...

01 / FRANÇAIS
02 / ANGLAIS
03 / JAPONAIS

En France, on associe souvent l'alcool au bon vin, mais également à l'alcoolisme, aux jeunes qui font trop la fête et aux accidents de la route.

Dans la culture anglo-saxonne, on pense à la bière, à la fête mais également à la débauche.

Au Japon, beaucoup moins de communication sur les méfaits de l'alcool sont médiatisées, ce qui peut nous laisser croire qu'il est moins diabolisé :
Entre collègues après le travail, entre amis… On ne laisse pas le verre de son voisin se vider. 

1.

Le mot "alcool" est associé à des connotations négatives en français et en anglais.

2.

Le mot "alcool" est associé à des connotations positives en japonais

Hypothèses

Nous avons écrit en script en Bash afin de créer un tableau HTML qui réunit automatiquement plusieurs informations sur nos URLs à partir des dites URLs : 

- le code HTTP de la page

- l'encodage de la page

- l'URL

- une aspiration HTML de la page 

- le texte de la page aspirée

- les index

- liste des bigrammes

- les contextes d'apparition de notre mot ("alcool")

- la fréquence d'apparition du mot "alcool" dans la page

Ce script en Bash met tous les textes à la suite pour créer un corpus de tous les articles triés par langue. Il nettoie également le corpus. 

A partir de ce script Bash, nous avons fait un script en Python qui a la même vocation mais qui fonctionne un peu différemment. 

Nos analyses ont été faites grâce à l'outil textométrique iTrameur. 

Nous avons documenté toute notre avancée dans ce projet sur notre blog.

Méthodologie

ANALYSE

FRANÇAIS

CONNOTATIONS NEGATIVES

Certains mots font partie du champ lexical de la blessure, comme "chute" et "décès". On trouve également le mot "volant" qui, lorsqu'il est lié à l'alcool, concerne souvent des acidents de la route ou bien des conduites en état d'ivresse. 

Le mot "consommation" est sûrement présent dans le contexte "consommation d'alcool". Bien que cette locution ne soit pas inhéremment négative, elle est rarement utilisée pour exprimer quelque chose de positif. On l'utilise souvent pour parler de l'alcoolisme ainsi que ses effets néfastes sur le corps. 

Le mot "sang" fait sûrement référence au taux d'alcool dans le sang et il est rare d'évoquer cette donnée sans que cela soit négatif. 

Enfin, la consommation de drogue en tout genre en France étant encore très mal vue, on peut considérer que la présence du mot "cannabis" est une connotation négative.

 

CONNOTATIONS NEUTRES

Dans les occurrences, on trouve beauoup de mots-outils qui n'ont donc ni connotations particulièrement positives ou négatives : "sans", "après", "à", "il", "de"...

On trouve également les mots "boissons" et "vin" qui font sens contenu de notre sujet. 

Enfin, on trouve d'autres mots dont nous ne comprenons pas spécialement la présence tels que "Russie" et "série". 

CONNOTATIONS POSITIVES

On pourrait considérer que le mot "vin" est une connotation positive étant donné que la France est connue pour sa production de bons vins. Ceci dit, cela ne reste qu'une hypothèse car nous n'avons pas le contexte.

ANGLAIS

CONNOTATIONS NEGATIVES

Dans le réseau de coocurrences en anglais, on retrouve des mots à connotations exclusivements négatives car ils font partie du champs lexical de la maladie : "disorder" (trouble), "illnesses" (maladies). Il y a également des mots qui impliquent une blessure comme "wreck" (accident) et "risk" (risque). 

Certains mots sont liés à la drogue ou du moins à des substances vues comme telles, comme "drug" (drogue), "tobacco" (tabac) et "cbd". Ce sont des connotations négatives car la consommation de drogue est encore mal vue dans de nombreux pays anglophones. 

Les mots "motorcycle", "speed" (vitesse) et "wreck" (accident) évoquent des accidents de la route liés à la consommation de boissons alcoolisées. 

Le mot "consumption" (consommation) est souvent utilisé dans la locution "consommation d'alcool" qui est très souvent négative. 

CONNOTATIONS NEUTRES

On retrouve beaucoup de mots-outils comme "how", "you", "that", etc. qui sont donc neutres par rapport aux connotations.

Les mots "restaurants" ou "bars" sont neutres également. Ils semblent au premier abord être plus positifs mais nous avons préféré les classer dans neutres car il faudrait faire une analyse plus approfondie pour pouvoir les classer dans les connotations positives avec certitude. 

Pour ce qui est du mot "quanrantine" (confinement), il semble être plus négatif mais encore une fois, nous l'avons classé dans neutre pour plus de sûreté. En effet, on pourrait penser à une augmentation de l'alcoolisme due à la situation sanitaire mais ce n'est qu'une hypothèse.

CONNOTATIONS POSITIVES

I'm a paragraph. Click here to add your own text and edit me. It's easy.

JAPONAIS

CONNOTATIONS NEGATIVES

Avec les résultats récupérés ici, il n’y a a priori qu’une forme négative du verbe boire (飲み nomi) que nous attribuerons à cette catégorie, notamment car elle peut se suffixer au mot sake pour donner le sens d’ivrogne.

 

Nous émettons toutefois des réserves sur cette analyse lexicale, car notre segmentation du japonais très probablement récupéré la forme conjonctive du verbe, qui ne serait alors plus considérée comme suffixée à alcool, mais plus probablement prédicat du mot alcool. Et donc, il prendrait le sens neutre de boire, plutôt que le sens collocatif d’ivrogne.

CONNOTATIONS NEUTRES

Une grande partie des termes retrouvés sont, nous semble-t-il, très neutre. La majorité d’entre eux semblent parler de confection, d’ingrédients, ou types d’alcool. En voici la liste, et à vous de vous en faire une idée. Les trois premiers termes, ci-dessous, peuvent s’associer avec le caractère d’alcool pour créer un autre mot (désignés entre parenthèses).

混成 = mixage (cocktail)

醸造 = brassage (alcool brassé)

蒸留 = distillation (alcool distillé)

種類 = variété

分類 = catégorie

原料 = ingrédient

果実 = fruit

米 = riz

ビール = bière

ウィスキー = whisky

ワイン = vin

On peut aussi ajouter la forme verbale de boire (飲む nomu) dont on est à peu près sûrs cette fois-ci qu’il n’est rien d’autre qu’un verbe.

CONNOTATIONS POSITIVES

Pour les connotations positives, nous avons ici un verbe qui rentre dans cette catégorie de manière indiscutable :

 

楽しむ = s’amuser/profiter

 

Enfin, nous avons ajouté un autre terme, celui d’adulte (成人 seijin). Bien qu’il puisse être tout simplement utilisé de manière neutre, il est aussi probable qu’il fasse référence à l’âge auquel on est autorisé à boire, ou à la très attendue fête du passage à l’âge adulte au Japon, ou « seijinshiki » à laquelle toutes les personnes qui ont 20 ans cette année-là fêtent ensemble (et souvent avec de l’alcool) cet évènement.

SYNTHESE

undraw_pending_approval_xuu9_edited.png
VERIFICATION DE NOS HYPOTHESES

Nos hypothèses étaient que :

1. le mot "alcool" a des connotations négatives en français et en anglais

2. Il a des connotations positives en japonais.

 

D'après nos résultats, nos hypothèses sont confirmées. En effet, en français comme en anglais, on retrouve ces notions d'accidents de la route et de drogue. Par ailleurs, les seuls mots à connotations positives dans ces langues sont discutables car nous aurions besoin de plus de contexte pour l'affirmer, comme avec le mot "vin" par exemple.

 

En revanche, en japonais, les connotations positives sont irréfutables : "楽しむ" (s'amuser/profiter). Au contraire des deux premières langues, les mots japonais que nous retrouvons en connotations négatives sont ambiguës. Les mots à connotations neutres sont, quant à eux, très nombreux. Cela démontre d'une meilleure image de l'alcool dans les médias japonais.

undraw_flagged_2uty_edited.png
LIMITES DE NOS ANALYSES

La quantité de données

Bien que notre analyse sur 150 URLs nous ait permis d'obtenir une première idée des connotations liées à l'alcool, la quantité de données est selon nous trop faible pour pouvoir en tirer de vrais résultats solides qui pourraient être généralisables.

Le manque d'objectivité

Les URLs sur lesquelles étaient basées nos analyses ont été choisies à la main. Cela pose un réel problème pour nos résultats. Le fait de rechercher dans un genre de textes spécifique comme, ici, des articles webs ou de journaux, biaise les résultats de l'utilisation du mot "alcool" dans toutes les langues. En effet, les lignes éditoriales de chacun connote son utilisation (en bien ou en mal). On peut toutefois se permettre de dire que pour un genre donné, notre méthode nous a permis d'avoir une première vision des associations lexicales qui s'opèrent avec le mot "alcool" dans chacune de nos langues.

 

Il aurait été intéressant de pouvoir utiliser un programme qui récupère des URLs automatiquement lorsque le mot que nous voulons apparaît sur la page. C'est justement ce que nous avons essayé de faire. Le script semblait fonctionner au premier abord mais finalement les résultats n'étaient pas ceux escomptés.

L'approfondissement

Par manque de temps, nous n'avons utilisé que les réseaux de cooccurrences sur iTrameur. Il aurait été intéressant d'utiliser d'autres fonctions ou de segmenter notre corpus en section, par exemple selon les types de sites. Cela nous aurait permis d'approfondir et d'affiner notre analyse.