• 1
  • 2
  • 3

Notre projet

Bienvenue à vous, chers visiteurs !

Ce site présente les résultats du projet "La vie multilingue d'un mot sur le web" dans le cadre du cours "Programmation et projet encadré" du Master 1 Plurital. Avec l'aide de M. Serge Fleury et M. Jean-Michel Daube, nous avons découverts les bases de la programmation ainsi qu'un certain nombre d'outils de traitement automatique du langage. La réalisation du projet s'est faite en plusieurs étapes, que nous détaillons dans notre blog :

- la constitution d'un corpus multilingue : nous avons extrait automatiquement les textes provenant d'URLs en français, en albanais et en arabe. Pour plus de cohérence, nous avons fait le choix de nous concentrer uniquement sur les articles de presse. Le résultat de l'extraction est présenté sous la forme de tableaux. Vous pouvez consulter notre script pour de plus amples informations.

- le traitement du corpus : nous avons utilisé l'outil de textométrie Trameur pour observer le contexte dans lequel est utilisé le mot "laine" dans nos différentes langues de travail.

- l'analyse du corpus : nous avons analysé les résultats obtenus à partir du Trameur et nous les avons illustrés avec les nuages de mots.

Notre équipe

Author 1

Titulaire d'une Licence en Langue française, j'ai souhaité me diriger vers le Tal en Master. Si les lignes de codes m'effrayaient quelque peu au début, je me découvre désormais un réel intérêt pour le développement informatique.

- Morgane Dehareng
étudiante à l'INALCO
Author 2

Anciennement étudiante en linguistique, je ne pensais pas un jour me diriger vers de l'informatique mais finalement la programmation se présente comme la clef de ma réussite.


- Chaïma Guellim,
étudiante à Paris 10
Author 3

Après avoir validé mon master en analyse du discours, j'ai tenté le Tal par curiosité. Je ne m'attendais pas autant de programmation mais la formation est très intéressante. J'espère m'améliorer en informatique et devenir ingénieure linguiste d'ici deux ans.

- Wahiba Bouaoudia
étudiante à Paris 3