XML::RSS

 

XML::RSS est un module créé spécialement pour faciliter la manipulation du contenu des fichiers RSS, c'est-à-dire soit pour créer ce type de fichiers, soit pour en extraire des informations, ou les "parser".

 

Nous l'avons utilisé à l'étape d'extraction de données, en prenant le script initial et en ajoutant l'appel spécifique du module dans l'entête du programme :

 

structure balisée des fichiers RSS

 

 

ainsi que le code spécifique pour pour parcourir chaque fichier et identifier les balises des titres et des résumés:

 

structure balisée des fichiers RSS

 

Le traitement des données s'est très bien passé, par rapport aux autres modules qui ont posé quelques problèmes de balisage. C'est l'une des raisons pour lesquelles nous avons décidé de l'utiliser aussi à l'étape suivante.

 

Téléchargez le script ici

 

Les résultats obtenus sont aussi disponibles dans cette archive.

 

Pour améliorer l'affichage, nous avons créé aussi un feuille de transformation XSL.

 

 

Pour accéder directement au contenu de cette feuille de style, cliquez ici.