Présentation du projet

Notre corpus de travail est une arborescence de fils RSS du journal Le Monde, recueillis tous les jours de l'année 2021 à 19h . L'arborescence contient un répertoire pour chaque mois de l'année, dans ces derniers se trouvent des dossiers. dans ces répertoires, on trouve les fichiers qui nous intéressent : les flux RSS de chaque rubrique, au format XML. Les rubriques ont chacune un identifiant, ce qui nous permet d'identifier facilement les différents fichiers de flux RSS.