Présentation du projet

Notre corpus de travail est une arborescence de fils RSS du journal Le Monde, recueillis tous les jours de l'année 2021 à 19h . L'arborescence contient un répertoire pour chaque mois de l'année, dans ces derniers se trouvent des dossiers. dans ces répertoires, on trouve les fichiers qui nous intéressent : les flux RSS de chaque rubrique, au format XML. Les rubriques ont chacune un identifiant, ce qui nous permet d'identifier facilement les différents fichiers de flux RSS.

BOITES À OUTILS ( BÀO )

Traitement de fils RSS pour leur analysis linguistique

Moi

Je suis Nacim BEN SIDI AHMED, étudiant en Master 1 Traitement Automatique des langues à l'inalco.