author

Représentation en graphes

I. INTRODUCTION :


À l'aide du programme patron2graphe.exe, on va pouvoir générer des graphes à partir des patrons extraits dans la phase BAO 3. Ce faisant, on observera plus en détail le contenu et la distribution textuelle de certains éléments faisant partie des rubriques. Voici les deux versions disponibles du programme :




II. REPRÉSENTATION GRAPHIQUE :


2.1. Rubrique 3476 (Cinéma) -- NOM+ADJ :


MOTIF=\b[aA]cteurs?\b|\b[aA]ctrices?\b

L'intérêt de l'analyse de ce terme repose principalement sur sa distinction grammaticale de genre et nombre. Est-ce qu'on trouvera des cooccurrents distincts en fonction de la forme utilisée?

À la vue du graphe affiché ci-dessous, on s'aperçoit que les quatre formes du lemme acteur sont très fréquemment associées aux nationalités des référents qu'ils désignent (anglais, italienne, espagnol...). Il faudrait remarquer à ce propos l'utilisation élevée du terme américain (5 occurrences), ce qui suggère la prodigalité des films américains dans la section choisie.

À la lecture des graphes entourant actrice et actrices, ce qui se démarque des autres réseaux, c'est la présence de l'adjectif fétiche (qui porte la signification de « muse d'un cinéaste »), inutilisé lorsque le référent est un homme. En revanche, ce qui partagent les formes masculines et féminines, c'est leur contiguïté des formes référant aux personnes afro-américaines: noirs, noires, afro. Cela nous paraît un phénomène particulièrement intéressant dans un contexte où la majorité d'adjectifs sont de nature ethnonymique...


author


2.2. Rubrique 3260 (Livres) -- NOM+ADJ :


MOTIF=\b[aA]nti.+\b

On a cru suggestif de regarder les composants des mots qui contiennent le préfixe anti-, d'autant plus que l'opposition exprimée par son sème principal le rend énormément productif et, par là même, cela favorise l'identification des néologies, souvent liées au contexte social et politique de nos jours.

À l'analyse de données, on a bien remarqué que le resultat obtenu correspondait dans une large mesure à ce qu'on s'attendait. Par contre, à cause de l'ampleur du motif choisi, on a également capturé des occurrences telles que Antiquité ou antillais. De toute façon, la liste d'occurrences contenant anti- en tant que préfixe reste assez large et variée :
        • On observe des occurrences relevant du domaine politique : antisémite, antiapartheid, antidreyfusarde, anti 68...
        • Ainsi que philosophique : antispéciste.
        • Et littéraire : antiroman.

Vu qu'il s'agit de la rubrique « Culture », on peut supposer que l'usage de ce type de termes sert à décrire (ou qualifier) les évènements historiques et les œuvres qui y sont présentées.


author


2.3. Rubrique 3246 (Culture) -- NOM+PREP+NOM+PREP+NOM :


MOTIF=\b[sS]ans\b

L'intérêt de l'analyse de la préposition sans s'inscrit dans le domaine de la pragmatique. Dans la mesure où elle désigne l'absence ou privation de quelque chose qui est propre à un terme reféré précédement dans le co-texte (notons que cette absence peut être proprement fondée sur l'ontologie de l'objet, mais également sur les inférences et présuppositions du locuteur...), on cherchait à savoir quels étaient ses cooccurrents dans la rubrique « Culture ».

Même si l'on trouvait notre hypothèse de base très prometteuse, les résultats renvoyés sont si hétérogènes qu'on ne peut à peine en tirer des conclusions... D'ailleurs, les occurrences extraites sont toutes des hapax et relevent des domaines divers. Par exemple, le binôme sans éthique fait référence à quelque chose de censurable du point de vue social, alors que étrangers sans titre de séjour réfère à des personnes en situation irregulière...

On peut effectivement exprimer nos propres intutions à la lumière des résultats; pourtant, leur nature hétérogène ainsi que l'homogénéité des fréquences rendent impossible une analyse ultérieure...


author


2.4. Rubrique 3246 (Culture) -- NOM+ADJ :


MOTIF=\b[Ii]ntell.+\b

Ce motif nous a paru intéressant d'un point de vue sociolinguistique. Intelligence, intellect, intellectuel... À quoi on l'associe cognitivement dans la langue française? Qu'est-ce que ça personnifie comme concept? La raison pour laquelle on a choisi cette rubrique repose sur le fait qu'elle est la plus riche thématiquement parlant.

Ainsi, un pourcentage consistant des occurrences a reçu le terme « intelligence » du point de vue scientifique et technique. On voit des exemples comme intelligence artificielle ou machines intelligentes, c'est-à-dire, ceux qui sont les plus susceptibles d'apparaître dans une rubrique telle que « Science » ou « Technologie ». Bien que ce soit difficile de l'analyser sans un appui contextuel, on pourrait supposer que les articles de Le Monde touchaient les questions éthiques du progrès et les enjeux de cette technologie.

Les autres occurrences contenues dans le graphe constituent en majorité des hapax qui dénotent la nationalité des intellectuels (français, suédois, italien) et les collocations plus au moins classiques pour le style journalistique comme vie intellectuelle, débat intellectuel. Il faut également mentionner les épithètes assez poétiques tels que passions intellectuelles, générosité intellectuelle ou foudre intellectuelle. En général, on observe une connotation neutre/positive dudit terme dans notre corpus.


author


2.5. Rubrique 3246 (Culture) -- V+DET+NOM :


MOTIF=\b.+?isme\b

Initialement, nous avions réfléchi à d'autres patrons suffixaux comme -tion et -ité (qui nous ont semblé trop abstraits). Pourtant -isme est le pain et le beurre du journalisme, dans la mesure où il désigne des événements, mouvements et expériences sociales, politiques et spirituelles qui ont été lexicalisées dans la langue. Pour effectuer cette tâche, on a choisi la rubrique « Culture » et le patron VERBE - DET - NOM. De cette façon on peut voir aussi l'attitude de l'auteur vers le concept qui nous intéresse.

Ainsi, on a trouvé principalement des hapax et des occurrences indiquant des phénomènes ou évènements plutôt historiques et non pas contemporains : suprémacisme, franquisme, fascisme, colonialisme, cannibalisme.

D'autre part, on a répéré un bloc concernant plutôt le domaine artistique (c'est à ça qu'on se serait attendu à la rubrique « Culture »: expressionnisme, éclectisme, érotisme). Néanmoins, on remarque également l'intéressante distribution des articles définis et indéfinis et, plus notamment, l'usage très inhabituel de ces derniers: un anti-humanisme, un féminisme, un racisme. Quant aux verbes, ils ne portent aucune nuance émotionnelle, ce qui se révèle quelque chose de classique pour ce genre. On répère des mots comme: développer, approche, oppose, attaque, renvoie, dénoncent, défend. Cela semble montrer que notre intuition linguistique était plutôt erronée...


author


2.6. Rubrique 3244 (Sciences) -- NOM+ADJ :


MOTIF=\b[Bb]io.+\b

Bien que le phénomène de produits bio soit de plus en plus connu au niveau mondial, il va sans dire qu'il a surtout gagné les cœurs des français... Face à ça, la communauté scientifique internationale se moque du bio, en le traitant comme un concept exclusivement commercial et même dangereux. C'est pourquoi, il semble intéressant de capturer comment les articles de presse scientifiques reflètent cette question. Pour ce faire, on a décidé de prendre un patron plus ample qui rattrape toutes les occurrences liées à la biologie. Ainsi, on a choisi la rubrique « Sciences » et le patron NOM - ADJ.

C'est que l'on constate, c'est que le sujet le plus fréquemment lié à la biologie c'est le monde aquatique. Cela est bien confirmé par des exemples tels que : biodiversité aquatique, biodiversité marine, biotechnologies marines, biologiste marin, biomimétisme marin.

En général, les occurrences trouvées sont toutes rapportées au domaine scientifique et écologique (dans un usage plutôt neutre) : pailles biodégradables, conception bioclimatique, biodiversité sauvage, biomasse exploitable. En revanche, on n'a trouvé très peu d'exemples de bio liés à l'idée de production non industrielle: l'occurrence le plus remarquable serait agriculture biologique.


author


2.7. Rubrique 3476 (Cinéma) -- NOM+ADJ :


MOTIF=\b[Cc]omédie|[Dd]rame\b

Dès l'Antiquité, le drame et la comédie sont considérés les deux grands genres de la littérature, art théâtral et cinéma plus récémment... Pourquoi ne pas regarder leurs associations à l'heure actuelle?

À première vue, on constate que la comédie comporte beaucoup plus d'occurrences et contient un champ sémantique plus varié. Notons que le drame n'était mentionné que 5 fois en 2018. En même temps, la comédie n'est pas seulement suivie par des adjectifs dénotant le genre comme comédie criminelle, musicale, policière, social, mais aussi bien par un nombre d'épithètes assez inhabituels dans ces coocurrents : comédie loufoque, comédies espiègles, comédie funèbre, comédie drolatique, dépressive (oxymoron).

En outre, le patron comédie a attrapé aussi le terme comédien suivi principalement par les nationalités correspondantes du référent désigné. Ici, ce qui semble intéressant, c'est l'orthographe de l'expression comédien-ne-s, noir-e-s, une façon de représenter la distinction de genre et nombre qui est de plus en plus répandu dans la presse.


author




Site crée par Lucía ORMAECHEA GRIJALBA & Veronika SOLOPOVA