Introduction globale

Le descriptif de ce cours (présentation sur la page du cours) :
Mise en oeuvre d'une chaîne de traitement textuel semi-automatique, depuis la récupération des données jusqu'à leur présentation.
Ce cours posera d'abord la question des objectifs linguistiques à atteindre (lexicologie, recherche d'information, traduction...) et fera appel aux méthodes et outils informatiques nécessaires à leur réalisation (récupération de corpus, normalisation des textes, segmentation, étiquetage, extraction, structuration et présentation des résultats...).
Ce cours sera aussi l'occasion d'une évaluation critique des résultats obtenus, d'un point de vue quantitatif et qualitatif.

Le corpus de travail : une arborescence de fils RSS (le journal Monde)


Télécharger ce corpus RSS de l'année 2019

Phases de BAO

Mon projet du premier semèstre

Il s'agissait d'utiliser les languages bash pour aspirer des pages en ligne concernant le sujet "MASCULINITÉ" en français, chinois et coréen.

CONTACT

Email
yimei.yue@sorbonne-nouvelle.fr