Démarche de notre projet

Le but de ce projet est de mettre en oeuvre une chaîne de traitement textuel semi-automatique, depuis la récupération des données jusqu'à leur présentation, ceci afin d'extraire un mot ainsi que le contexte dans lequel il apparaît.


Example pic


Choix du mot

Nous avonc choisi le mot “Printemps”. Les évènements de 2011 dans les pays d'Afrique du Nord associent aujourd'hui le mot “Printemps” (de la même manière qu'il y a 40 ans avec le Printemps de Prague) à une idée de Révolution, de profonds changements, de réveil d'un peuple. Nous avons donc accès en ce moment à un foisonnement de sources où l'occurence de ce mot est associé à l'adjectif “Arabe”, ce qui n'existait pas avant début 2011.


Il nous semblait donc intéressant de comparer le sémantisme classique de Printemps (saison, réveil de la nature etc...) avec le sémantisme qui lui est donné par le biais de l'actualité, à savoir les révolutions successives en Afrique du Nord, le soulèvement des peuples.


Les différents sens du mot “Printemps”.


En Français ("Printemps") :


  • en Ancien Français, idée de premier (primus tempus d'où le mot Printemps est dérivé). Printemps se disait Primever, qui vient de l'adjectif vernal (le point vernal est l'équinoxe de Printemps)

  • première saison de l'année

  • une année supplémentaire

  • l'adolescence

  • idée de renouveau révolution, début d'une nouvelle période


En Anglais ("Spring") :


  • le printemps

  • la source

  • le ressort

  • idée de jaillissement, mouvement, recommencement

  • le verbe "to spring" veut dire bondir, jaillir


En Allemand ("Frühling") :


  • Frühling, à une valeur intemporelle, saisonnière, cyclique, liée à la poésie

  • Frühjahr, früh veut dire tôt, très forte notion de temporalité, associé à des références annuelles (défilés...)

  • Lenz veut dire une année suplémentaire au sens de l'expression Française "avoir 42 printemps"

  • Deux conventions d'écriture sont acceptables pour ce mot: Frühling et Fruehling, considérant la première comme préférée par les puristes


L'expression “Printemps Arabe” se traduit littéralement dans chacune des trois langues étudiées. On y retrouve ce concept commun de révolution, de réveil des peuples.


Example pic



L'idiome “Printemps Arabe” se décline donc en Anglais sous la forme “Arab Spring” et en Allemand, “Arabischer Frühling”.


Nous avons un mot, un idiome, ses traductions en Anglais et en Allemand, passons à la suite !


Problématique

L'idée qui a motivé le choix de ce mot en particulier est donc la suivante:

Serons-nous à même de mettre au jour la naissance du nouvel idiome "Printemps Arabe"?


Nous avons pris le parti de ne pas segmenter les corpus d'URL en fonction de leurs différents sens communs. Ce que nous trouvions intéressant était de comparer un corpus d'URL regroupant l'ensemble des sens communément admis du mot “Printemps” avec un corpus constitué d'URL mises en ligne à partir de Janvier 2011 (date de début des Révolutions Arabes) et regroupant uniquement des textes présentant l'expression “Printemps Arabe”.


Recherche d'URL

Le web fourmille d'outils de recherche. Pour effectuer notre recherche d'URLS, nous nous sommes servis d'outils facilement accessibles et qu'il n'est plus besoin de présenter tels que Google, Bing et Linguee.


Cependant, nous avons été confrontés à un problème que nous n'avions pas anticipé. Nous voulions nous servir principalement d'articles de journaux et de blogs pour le corpus “Printemps Arabe”. Par conséquent, beaucoup des URLS retenues provenaient de grands journaux quotidiens tels que “Le Monde”, “Le Figaro” ou encore “Le Guardian”.


Problème, ces sites sont constamment mis à jour, certains articles peuvent voir leurs URLS changer ou encore être archivés et par conséquent ne sont plus disponibles gratuitement à la consultation. C'est ainsi que nous avons vu fondre notre corpus au cours des mois, une majorité d'URLS n'étant plus exploitables. Il a donc fallu mettre à jour une partie importante de notre corpus afin que l'on puisse obtenir des résultats probants.



Outils :

Liens :