Analyse Textométrique

Les premiers pas dans l'analyse ont commencé lors de la génération de nuages de mots à partir de tous nos fichiers concaténés. Malgré quelques répétitions de lignes observées dans ceux-ci (certainement dûes aux titres des articles affichés sur la même page), cette première vision d'ensemble nous a permis d'obtenir un résultat graphique de la fréquence des occurrences du mot dans chaque langue, sans traiter séparément le singulier et le pluriel.
Toutes les URLs sur lesquels se basent notre analyse se limitent pour le français à des articles de presse française, et pour l'arabe à des articles de presse arabophone algérienne.

Nuages de mots en arabe

Un nuage de mots consiste en l’affichage des mots les plus fréquents employés dans le contenu des fichiers dumps concaténés. Plusieurs applications permettent la réalisation de nuages de mots simples (Wordle) ou avec des formes (Nuagesdemots). Ce dernier ne fonctionnant avec l’arabe, nous avons pu trouver une alternative sur Tagxedo.
La représentation de la fréquence des mots est proportionnelle à la taille graphique du mot. Ainsi, nous pouvons constater que les mots les plus présents sont par ordre décroissant : Constantine, la Capitale, Algérie, Alger, Ouyahia (Premier ministre algérien), publiques, services, chemins de fer, Mlila, banlieues, locale, l’armée, président, stratégie, le travail, projet, etc.

Cet environnement linguistique n’est a priori pas négatif.

Nuages de mots en français

Le site nuagesdemots.fr a permis de créer le nuage de mots en français.

Dans cette forteresse de mots, le mot "banlieue" au singulier ressort face à son pluriel. On observe une prédominance des mots "France" et "Paris" qui est révélatrice de l'emploi du terme en contexte - les articles qui constituent le corpus réfèrent aux banlieues françaises, voire principalement parisiennes, mais également du vocabulaire que l'on retrouve dans les articles de presse concernant l'actualité politique :  "Politique",  "Macron", "Trump", "ministre", "gauche", "Daech", "relations", "guerre", "migrants", "nationale", ainsi que du vocabulaire qui pourrait détailler des faits divers comme "terrain", "policiers", "police", "sexuelles", "procureur", "élèves", "CRS", "suspects" ou "accusé".

Outre l'environnement connoté que la présence de ces mots peut engendrer, on constate aussi la présence d'un certain nombre de mots à connotation péjorative : "morts", "mort", "viol", "coups", "contre", "craint", "Attentat", "drogue" (...) ainsi que quelques noms de personnalités comme Tariq Ramadan ou Mohammed Merah, le premier étant islamologue et le second un terroriste islamiste.

En comparaison avec le nuage de mots en arabe, cet environnement semble beaucoup plus négatif.


Nous avons ensuite opéré une analyse plus ciblée sur les mots en contexte en se basant sur les résultats obtenus avec iTrameur et les contextes résultant du minigrep multilingue (donc vous pouvez observer les résultats dans les tableaux).

Contextes en arabe

D’après le dictionnaire elmaany, l’étymologie du mot [dˤāħija] vient du verbe "apparaitre". Par extension, le mot renvoie à une zone “apparente” (dans le sens d’importante) située en dehors de la ville, ou à une agglomération construite autour d’une capitale ou d’une grande ville.

Nous avons analysé "banlieue" au singulier et au pluriel séparément en arabe, d'autant plus que les deux mots n'ont pas la même forme graphique. Dans la langue arabe, certains mots prennent une forme irrégulière qui n'est pas celle qu'ils devraient prendre au féminin ou au masculin pluriel. Plusieurs lettres changent donc d'ordre.En effet, le mot au pluriel change de forme et prend celle du pluriel brisé.

Intuition de contexte d’utilisation : à première vue, le mot est employé dans la presse arabophone algérienne pour décrire des faits ou des projets ayant lieu en dehors du centre-ville.

> Vous pouvez consulter le résultat de minigrep sur la totalité des fichiers (les contextes qui entourent chaque occurrence dans chaque article) ici.

Mot « ضاحية » banlieue en arabe :

Les résultats observés des cooccurrents de notre motif banlieue au singulier nous indiquent des mots répétés un certain nombre de fois : Argenteuil, arrestations, agitations, mosquée, Stockholm, Toulouse, Aulnay-Sous-Bois, la Police, Montrouge …

Des résultats pour le moins étonnants si ce n’est inattendus. En effet, lorsque nous observons les contextes de plus près, l’emploi du mot banlieue au singulier semble correspondre à la description d’événements ayant lieu dans les « banlieues » françaises et rarement pour aborder l’actualité dans les banlieues algériennes. Un emploi dépréciatif au vu du contexte français qui pourrait être expliqué par la proximité géographique ainsi que le lien historique entre les deux pays aidant à bien connaître la société française.

Mot « ضواحي » banlieues en arabe :

Quant aux résultats observés avec l’utilisation du mot banlieue au pluriel en arabe, ils sont tout à fait à l’opposé de ceux cités plus haut. En effet, la majorité des contextes renvoient à des évènements, des faits divers ou des projets relatifs à des villes ou à des communes algériennes, à titre d’exemple : « Boumerdes » une ville limitrophe de la capitale où l’on évoque le cambriolage de la maison d’un homme d’affaires et homme politique algérien résidant dans « les environs de » cette ville. Un autre exemple où l’on aborde l’actualité concernant la grève des conducteurs de trains des « environs d’Alger ». La description reste factuelle et emploie ce terme comme synonyme de « environs de » et n’est donc aucunement péjorative.

Contextes en français

Une banlieue refère à un territoire et à l’ensemble des localités qui environnent une grande ville. Si cette définition semble correspondre à la traduction en arabe, “banlieue” et son pluriel ne réfèrent pourtant pas seulement à la périphérie dans la langue : ces noms ont une connotation péjorative qui se reflète dans leur contexte d’utilisation ou dans leur dénotation, à tel point qu’ils se voient même parfois utilisés comme des adjectifs dans des phrases comme “Cet accent est tout à fait banlieue” (cf. CNRTL).

> Vous pouvez consulter le résultat de minigrep sur la totalité des fichiers (les contextes qui entourent chaque occurrence dans chaque article) ici.

On trouve plus d'occurrences du mot "banlieue" au singulier qu'au pluriel en français, et c'est en étudiant les cooccurrents qu'apparaissent des preuves plus concrètes de la connotation péjorative du mot en français.

Intuition de contexte d’utilisation : le mot au pluriel ou au singulier semble ne pas désigner de position géographique mais bien plus souvent un concept décrivant des zones sensibles, des quartiers défavorisés sur lesquels une politique est mise en place.

A priori, "banlieues" n'est pas corrélé à des noms de villes et s'entoure de mots bien plus forts négativement que "banlieue", dont les contextes semblent un peu plus relater des évènements - peu joyeux en général. L'hypothèse serait alors que l'on parlerait des banlieues pour les dévaloriser, mais de la banlieue de Marseille ou de celle dont vient telle personnalité pour y conter des faits sensationnels.

Banlieue (singulier) :

Sans surprise, "parisienne" est le mot qui apparaît le plus fréquemment en cooccurrent de "banlieue", les évènement relatés dans les articles abordant souvent des problèmes survenant en région parisienne. Vient ensuite "Jeannette Bougrab", personnalité politique issue de la banlieue parisienne qui a probablement dû faire une ou plusieurs apparitions dans la presse en 2017.

On constate une fréquence élevée de prépositions telles que "en", ou "de" qui à l'observation des contextes se trouvent la plupart du temps avant le mot ("en / de banlieue"). Ceci fait écho au fait que la banlieue désigne bien plus une idée que la périphérie d'une ville. Souvent, ce sont les "jeunes" (autre cooccurent fréquent) qui sont "de banlieue", "en banlieue" étant généralement suivi d'un point ou d'une virgule. Un autre cooccurrent à forte fréquence est "parents", correlé dans les contextes à "bénéficient de l'argent de la drogue", propos énoncés par Jeanette Bougrab. Certains noms propres comme "Fleury-Mérogis" (prison) ou "Ulis" (cité HLM) apparaissent également.
Le reste du lexique contient certains mots à valence négative (à priori), comme "subir", "cause" (dans le sens de "causer quelque chose à quelqu'un"), "nuisances", "capitale" ou "gronde".

Ici, il semble que ce soit non pas les mots en eux-mêmes qui portent le plus cette connotation péjorative, mais leur agencement, leurs liens avec des noms de lieux sensibles et leur politisation qui rend l'ensemble globalement péjoratif.

Banlieues (pluriel) :

En contexte, "Banlieues" apparaît souvent comme le début d'un titre comme dans "Banlieues : "Il faut développer l'apprentissage"", assignant le mot à un thème, une rubrique, avec peu d'égard quant à la position géographique précise qu'il pourrait désigner. Autrement, "les banlieues" sont des zones auxquelles on assigne une politique particulière et généralisée à l'ensemble non pas de la périphérie mais bien de certains quartiers dits "sensibles", qu'il n'est presque pas nécessaire de préciser tant il est facilement compris par les lecteurs. Par ailleurs, on observe qu'il faut "prendre en main les banlieues", "des banlieues où on n'est plus en France", à cause du "Banditisme et de l'islamisme (dans les banlieues)".

Les cooccurrents du pluriel en revanche sont bien plus porteurs de cette valence négative en eux-mêmes ; des mots comme "Banditisme", "massacrés", "chaos", "conquis" ou "antifrançaise" le démontrent aisément.

Il semble possible d'émettre l'hypothèse que le pluriel apparaît plus fréquemment dans la presse de droite ou d'extrême droite que dans celle de gauche, et qu'il s'emploie majoritairement pour désigner un concept, une idée véhiculée politiquement, tout en l'aggrémentant généralement de cooccurrents très négatifs.

Analyse linguistique

Finalement, il en ressort que "banlieue(s)" en français a une connotation fortement négative qui n'est reprise en arabe et au singulier quasiment que pour désigner les banlieues françaises (et généralement parisiennes). Autrement, "banlieues" en arabe a plutôt tendance à référer à des environs, et ne désigne ainsi tout simplement qu'une zone géographique lorsqu'il s'agit d'un endroit situé sur le territoire algérien. La valence du mot en arabe est donc neutre, tandis que celle du mot en français est négative en contexte.
Comment l'expliquer ?

A travers une perspective sociolinguistique, le mot en français semble tenir sa connotation de la politique française appliquée à ces territoires. A partir de la fin des années 1980, on assigne le terme "quartiers sensibles" à une certaine partie de la ville située en périphérie urbaine et marquée notamment par l'immigration et la construction de logements sociaux. Selon l'Insee, 40% de la population immigrée européenne (Italie, Espagne, Portugal) et africaine (Algérie, Maroc, Afrique subsaharienne) vit dans l'aire urbaine de Paris, contre 20% de non-immigrés (source : Insee). Ces zones réfèrent généralement aux "quartiers prioritaires de la politique de la ville", des lieux souvent mentionnés dans les articles de presse de notre corpus. D'après Cyprien Avenel (sociologue), "Les problèmes des banlieues font l'objet d'une intervention spécifique et volontariste des pouvoirs publics. Les quartiers réputés sensibles sont définis comme étant le récéptacle de la plupart des maux de la société française en étant régulièrement le théâtre de violences diverses. Ils symbolisent la concentration des phénomènes de l'exclusion et cristallisent les peurs face à l'insécurité". Ainsi, ce sont non pas les banlieues en elles-même qui semblent poser problème mais bien leurs habitant.e.s, ghettoïsé.e.s et relegué.e.s dans des territoires spécifiques et aménagés de sorte à les isoler par les pouvoirs publics en place. La sociologue Sylvie Tissot parle d'une "montée en puissance de cette manière de voir, généralement rapportée à l’apparition, à la fin des années 1980, d’une nouvelle politique publique, la politique dite de la ville (qui cible plusieurs centaines de quartiers « en difficulté ») ainsi qu’à la focalisation médiatique sur les « banlieues »".

Conclusion

Ce travail nous aura permis d'accompagner de preuves textométriques notre hypothèse de départ, mais aussi les diverses tentatives d'analyse des sciences humaines et sociales quant aux problèmes relatifs aux banlieues. Les médias étant un vecteur capital dans la transmission et le façonnement d'idées, faire le lien entre le contenu véhiculé par des articles de presse et l'analyse réalisée par divers théoricien.ne.s nous a permis d'une part de confirmer notre hypothèse de départ, et d'autre part de découvrir aussi l'influence qu'un mot politisé en France peut avoir jusqu'à se retrouver dans une presse étrangère comme la presse algérienne.

Nous avons grandement apprécié de travailler ensemble sur ce thème durant ce premier semestre, et nous sommes d'autant plus satisfaites d'avoir obtenu des résultats révélateurs. Mais, si ce travail s'est avéré très formateur en matière de programmation informatique, il est regrettable de ne pas avoir pu consacrer autant de travail et d'importance à l'analyse linguistique de nos résultats pour en dresser une conclusion théorique solide. Un corpus plus conséquent à base d'articles sélectionnés avec beaucoup de précision nous aurait aussi permis de faire une analyse qualitative plus élaborée quant aux diverses sensibilités politiques de la presse.