La première boîte à outils permet de récupérer en format texte et xml les titres et descriptions des files RSS des deux catégories choisies. Pour ma part, je travaille sur les catégories idées et cinéma.
Voici les étapes du programme :
- Extraire le texte
- Intégrer ces traitements dans le programme de parcours d’une arborescence de fils RSS
- Préparer au moins 2 types de sortie : texte brut et texte structuré en XML
Le programme en Perl
Le programme en Python