Présentation de fils RSS du journal Le Monde

Le standard RSS représente un moyen simple d'être tenu informé des nouveaux contenus d'un site web, sans avoir à le consulter.

Le format «RSS» (traduisez «Really Simple Syndication») permet ainsi de décrire de façon synthétique le contenu d'un site web, dans un fichier au format XML, afin de permettre son exploitation par des tiers. Le fichier RSS, appelé également flux RSS, canal RSS ou fil RSS, contenant les informations à diffuser, est maintenu à jour afin de constamment contenir les dernières informations à publier.

Basiquement, un fil RSS est un fichier contenant le titre de l'information, une courte description et un lien vers une page décrivant plus en détail l'information. Cela permet à un site web de diffuser largement ses actualités tout en récupérant un grand nombre de visiteurs grâce au lien hypertexte permettant au lecteur de lire la suite de l'actualité en ligne.

Fils RSS du journal Le Monde

  • 17 fils RSS archivés une fois par jour (19h00) sur plusieurs semaines.
  • Chacun des fils est accompagné de sa version « textuelle » (dite profonde) au format Lexico3.
  • Période traitée : 20/11/2006-21/12/2006.

Les 17 fils RSS du journal Le Monde sont organisés par rubrique sur l'année 2016.

Organisation des fils RSS du journal Le Monde par rubrique

Rubrique Fils RSS FIls format texte
A la Une 0,2-3208,1-0,0.xml 0,2-3208,1-0,0.txt
International 0,2-3210,1-0,0.xml 0,2-3210,1-0,0.txt
Europe 0,2-3214,1-0,0.xml 0,2-3214,1-0,0.txt
France 0,2-3224,1-0,0.xml 0,2-3224,1-0,0.txt
Société 0,2-3226,1-0,0.xml 0,2-3226,1-0,0.txt
Environnement 0,2-3228,1-0,0.xml 0,2-3228,1-0,0.txt
Entreprises 0,2-3234,1-0,0.xml 0,2-3234,1-0,0.txt
Médias 0,2-3236,1-0,0.xml 0,2-3236,1-0,0.txt
Rendez-vous 0,2-3238,1-0,0.xml 0,2-3238,1-0,0.txt
Sports 0,2-3242,1-0,0.xml 0,2-3242,1-0,0.txt
Sciences 0,2-3244,1-0,0.xml 0,2-3244,1-0,0.txt
Culture 0,2-3246,1-0,0.xml 0,2-3246,1-0,0.txt
Technologies 0,2-651865,1-0,0.xml 0,2-651865,1-0,0.txt
Cinéma 0,2-3476,1-0,0.xml 0,2-3476,1-0,0.txt
Voyages 0,2-3546,1-0,0.xml 0,2-3546,1-0,0.txt
Livres 0,2-3260,1-0,0.xml 0,2-3260,1-0,0.txt
Présidentielle 2012 0,57-0,64-823353,0.xml 0,57-0,64-823353,0.xml

Le contenu des fils :




Les informations qui nous intéressent dans le contenu de fil RSS sont les contenus textuels des balises « title » et « description ». Durant l’étape BàO 1, nous allons appliquer un filtrage des données.