Ce site internet est le couronnement du cours intitulé "Programmation et projet encadré" enseigné durant le deuxième semestre du Master 1 Traitement automatique des langues. Ce cursus est suivi par des étudiants de l'INALCO, Paris III Sorbonne-Nouvelle et Paris X Nanterre.

Ce projet en quatre étapes a pour but le traitement et l'interprétation de données textuelles au sein d'une arborescence de fichiers. Plus bas, un schéma résume l'ensemble de ces étapes qui se déroulent sous forme de boîte-à-outils dont voici la liste:

La partie programmation a été exécutée à l'aide du langage de programmation Perl symbolisé par le dromadaire.

À propos de Perl

Le langage informatique Perl (Practical Extraction and Report Language) a été inventé en 1987 par le linguiste Larry Wall. Il avait été développé au départ pour traiter des données textuelles permettant de générer des rapports sur le fonctionnement du système UNIX. C'est historiquement le langage du TAL; il posséde certainement le meilleur moteur d'expressions régulières. De plus, il permet de faire en très peu de lignes de code, des programmes puissants et d'effectuer des opérations de manière extrêmement simple et rapide. Perl n'a que trois types de données: les scalaires, les listes et les tableaux associatifs. Voici un script perl les présentant avec quelques fonctions de base.