Les BAO 2013-2014


Bienvenue

Je suis Kévin Deturck étudiant du Master 1 Ingénierie Linguitique à l'Inalco pour la promotion 2013-2014.

Ce site présente le travail réalisé dans le cadre du cours "Projet Encadré" du second semestre au M1 PluriTAL 2013-2014.
L'objetif général de ce projet est de produire de vrais scripts en Perl pour différentes opérations sur corpus textuel.

=> Corpus Le Monde 2013 Extraction RSS tous les jours à 19h.

=> 352 jours d'archive

=> Format XML

=> Pratiquement 2 Go de données

=> Plus de deux jours de traitement pour BAO2

=> Un semestre de travail en commun puis personnel

Remerciements vers toute l'équipe pédagogique pour son soutien permanent.
Serge Fleury (Paris 3), Jean-Michel Daube (INALCO), Rachid Belmouhoub (INALCO)