Entrée : tous les fichiers XML du dossier 2016 de la rubrique "International".
Sortie :
Explications :
Les flux RSS sont organisés selon une arborescence de ce type :
Les numéros correspondent aux différentes rubriques du journal "Le Monde" :
Le script "BAO1-v1.pl" prend en paramètre :
Commande:
perl BAO1-v1.pl 2016 3210
Ce script va parcourir toute l'arborescence et extraire le contenu textuel des balises title et description des fichiers XML de la rubrique choisie (exemple : 0,2-3210,.-0,0.xml).
Le résultat de cette extraction est stocké dans deux fichiers : un fichier TXT et un fichier XML.
Veuillez cliquer ici pour afficher le code...