Je suis Kévin Deturck étudiant du Master 1 Ingénierie Linguitique à l'Inalco pour la promotion 2013-2014.
Ce site présente le travail réalisé dans le cadre du cours "Projet Encadré" du second semestre au M1 PluriTAL 2013-2014.
L'objetif général de ce projet est de produire de vrais scripts en Perl pour différentes opérations sur corpus textuel.
=> Corpus Le Monde 2013 Extraction RSS tous les jours à 19h.
=> 352 jours d'archive
=> Format XML
=> Pratiquement 2 Go de données
=> Plus de deux jours de traitement pour BAO2
=> Un semestre de travail en commun puis personnel
Remerciements vers toute l'équipe pédagogique pour son soutien permanent.
Serge Fleury (Paris 3), Jean-Michel Daube (INALCO), Rachid Belmouhoub (INALCO)