Ce site vous présente un projet du cours de "Programmation et projet encadré", dans le cadre du master 1 Traitement Automatique des Langues de Paris III/Paris X/INALCO.
Il s'agit d'un projet consistant à mettre en œuvre une chaîne de traitement textuel automatique afin de traiter des données multilingues que l'on a récupérées sur internet. Le traitement est procédé par plusieurs paliers, dont la conversion d'encodages.
Dans la deuxième phase on constitue les "nuages", alias appliquer des outils informatiques sur nos données, pour ensuite pouvoir les analyser et répondre à des objectifs linguistiques ciblés.
TAN Chang (voir le blog du travail)