Bienvenue sur notre projet La vie des mots 2013

Ce petit site de rendu vous présentera le résultat de notre travail dans le cours de projet encadré, dans le cadre de notre Master 1 en Ingénierie Linguistique. L'objectif de ce cours est de nous faire manipuler des données multilingues ainsi que divers langages de programmation et plusieurs logiciels de statistiques textuelles afin de mener à bien un travail d'analyse textuelle complet.

Pour ce projet, nous avons été amenés à faire de la construction de corpus à partir du web, à traiter des problèmes d'encodages divers, à construire des scripts d'analyse textuelle et à apprendre à utiliser des langages et des logiciels inconnus.

Nous avons centré notre projet autour des mots "11 Septembre", avec une problématique en deux axes : L'utilisation de ce terme comme chrononyme ou comme expression temporelle ; Les thématiques associées aux évènements du 11 Septembre.

Notre corpus est constitué d'articles provenant du web, pour la plupart venant de journaux en ligne. Mais nous avons peu sélectionné nos sources afin d'obtenir un corpus plus varié. L'essentiel du corpus provient des premiers résultats de recherche pour les mots-clef "11 Septembre" et leur traduction sur les moteurs de recherche et les archives de différents journaux.

Nos langues de travail sont le français, l'anglais, l'allemand et l'arabe. Au travers de ces quatre langues, un troisième axe de recherche se dessine : Quelles sont les différences dans les thématiques et l'utilisation de l'expression "11 Septembre" selon la langue du texte ?