Bienvenue!

Ce site a été créé pour le cours de "Programmation et projet encadré", dans le cadre du master 1 d'ingénierie multilingue (domaine du TAL- Traitement Automatique des Langues) de Paris III/Paris X/INALCO.

On y présente donc un projet qui consiste à mettre en œuvre une chaîne de traitement textuel semi-automatique afin de traiter des données multilingues que l'on aura récupérées sur internet. Cette chaîne doit traiter les données depuis leur création jusqu'à leur présentation dans un tableau, en passant par des étapes de conversion d'encodages si nécessaires.

Quant à la deuxième partie du projet que l'on a intitulée ici "nuages", il s'agit d'appliquer des outils informatiques sur nos données, pour ensuite pouvoir les analyser et répondre à des objectifs linguistiques que l'on s'est fixé; objectifs eux-mêmes tirés d'une problématique dénichée au prix de longues tergiversations... (si vous voulez en savoir plus, rendez-vous à la section Présentation!)

Enfin, vous trouverez également sur ce site les remarques et les conclusions que nous avons pu tirer de cette expérience, ainsi que quelques liens qui nous ont été utiles pour l'élaboration de ce projet.

Bonne visite~!

Pour les curieux, ce site a été élaboré à partir d'un canevas fourni pour un autre cours de Paris 3 (TAL, niveau licence 2), restructuré et amélioré à coups de balises HTML, puis poli avec du CSS à la Notepad++. Quant au lourd fond d'écran, il s'agit d'une photographie prise à Fukuoka en 2011 avec un CANON EOS 1000D ©I.Wang! Et voilà, maintenant vous savez tout...