Première boite à outils

Notre première boite à outils est constituée d'un programme écrit en perl. Ce programme permet de récupérer les titres et les descriptions, sur une année de fils RSS collectés, d'articles du journal Le Monde pour une rubrique donnée. Ce programme donne en sortie des fichiers au format .txt et .xml. Il prend deux arguments : le dossier contenant les fils RSS ainsi que la rubrique choisie.

J'ai choisi d'étudier ici les rubriques :

  • 3208 : Actualité
  • 3210 : International

Le Programme

Voici le programme que j'ai lancé avec le terminal de Windows 10 :


Veuillez cliquer ici pour voir le script.

Résultats

Voici les fichiers obtenus pour la rubrique 3208 (actualité):

  • Cliquer ici pour voir le document .txt contenant les titres et les descriptions.
  • Cliquer ici pour voir le document .xml contenant les titres et les descriptions.
  • Cliquer ici pour voir le document .txt contenant les titres.
  • Cliquer ici pour voir le document .txt contenant les descriptions.

Voici les fichiers obtenus pour la rubrique 3210 (international):

  • Cliquer ici pour voir le document .txt contenant les titres et les descriptions.
  • Cliquer ici pour voir le document .xml contenant les titres et les descriptions.
  • Cliquer ici pour voir le document .txt contenant les titres.
  • Cliquer ici pour voir le document .txt contenant les descriptions.