Bienvenue sur mon site !

Ce site est créé spécialement pour le projet final du premier semestre du cours "Programmation et projet encadré", dans le cadre du master 1 (2011-2012) d'Ingénierie Linguistique, Traitement Automatique des Langues basé sur trois établissements deParis III, Paris X et.INALCO

Ce projet consiste à traiter automatiquement des données textuelles multilingues que l’on a récupérées sur Internet. Après avoir récupéré ces données, la cinquantaine de textes bilingues (franco-khmer) concernant le mot « biocarburant = ជីវឥន្ធនៈ» a été traitée en quatre étapes en utilisant les différentes commandes comme « curl, wget, lynx, egrep, minigrep … » afin d’obtenir les contextes globaux. Voici mes travaux de la phase 1 du projet.

Dans la phase 2, on s’intéresse aux "nuages" en utilisant d’abord le logiciel « le Trameur » qui permet de faire des calculs textométriques à partir de notre corpus transformé en "trame", ou on peut dire simplement la fréquence des mots. Dans la deuxième partie de cette phase on a utilisé Wordle et Word It Out, chacun des logiciels sert à créer des nuages de mots avec qui font ressortir en gros caractères les mots les plus fréquents dans les contextes résultant des travaux de phase 1.

Vous trouverez sur mon site la présentation du sujet du projet et la démarche, les scripts, les résultats de travaux, la synthèse, les divers liens utiles ainsi que les remerciements.