• www.plurital.org
  • www.u-paris10.fr
  • www.univ-paris3.fr
  • www.inalco.fr

Quésaco?

Ce site à pour objet de presenter les travaux de TD effectués dans le cadre du master 1 plurital.

Le travail va s'effectuer sur un corpus constitué d'une arborescence de fichiers qui contiennent des fils RSS qui ont été recueillis tous les jours à 19h pendant l'année 2013 sur la page internet du journal le Monde

Tous les fils RSS sont constitués du titre de l'article, une description de celui-ci et l'article intégral.

Le journal du Monde est découpé en rubriques, pour chaque rubrique, il existe un fil RSS. Nous avons travaillé sur le titre et le résumé des articles.


Le langage de programation utilisé pour le projet est Perl qui est a était créé par Larry Wall en 1987 pour traiter facilement de l'information de type textuel.

La structure des données est elle en XML qui est un langage informatique de balisage générique qui dérive du SGML, reconnaissable par son usage des chevrons (< >) encadrant les balises.

Lien vers le projet

Université Paris X

Site PLURITAL