La première boîte à outils permet de récupérer en format texte et xml les titres et descriptions des files RSS des deux catégories choisies. Pour ma part, je travaille sur les catégories idées et cinéma.

Voici les étapes du programme :

  • Extraire le texte
  • Intégrer ces traitements dans le programme de parcours d’une arborescence de fils RSS
  • Préparer au moins 2 types de sortie : texte brut et texte structuré en XML

Le programme en Perl

Le programme en Python

Les résultats en format texte


Les résultats en format XML