Bienvenue sur mon site !
ELABORE PAR PEN MAKNIE
Ce site est créé spécialement pour le projet final du premier semestre du cours "Programmation et projet encadré", dans le cadre du master 1 (2011-2012) d'Ingénierie Linguistique, Traitement Automatique des Langues basé sur trois établissements deParis III, Paris X et.INALCO
Ce projet consiste à traiter automatiquement des données textuelles multilingues que l’on a récupérées sur Internet. Après avoir récupéré ces données, la cinquantaine de textes bilingues (franco-khmer) concernant le mot « biocarburant = ជីវឥន្ធនៈ» a été traitée en quatre étapes en utilisant les différentes commandes comme « curl, wget, lynx, egrep, minigrep … » afin d’obtenir les contextes globaux. Voici mes travaux de la phase 1 du projet.
Dans la phase 2, on s’intéresse aux "nuages" en utilisant d’abord le logiciel « le Trameur » qui permet de faire des calculs textométriques à partir de notre corpus transformé en "trame", ou on peut dire simplement la fréquence des mots. Dans la deuxième partie de cette phase on a utilisé Wordle et Word It Out, chacun des logiciels sert à créer des nuages de mots avec qui font ressortir en gros caractères les mots les plus fréquents dans les contextes résultant des travaux de phase 1.