BAO 1 - Résultats




Nous obtenons au terme de ce traitement deux fichiers résultats de type txt et de type xml. La sortie du fichier en texte brut nous donne de manière brut les articles de notre journal sans faire de distiction très nette entre le titre de l'article et sa description; nous ne les remarquons qu'avec les retour à la ligne. La sortie xml quant à elle, nous renvoit toutes les balises titres et descriptions avec leurs contenus. Ci dessous les liens vers les fichiers résultats txt et xml

  1. Fichier résultat.txt

  2. Fichier résultat.xml



Corpus
    Notre corpus est constitué de fils RSS du journal "Le Monde". Nous avons démarré notre projet avec le fichier 2008 constitué de fils RSS des journaux de 15 jours car le fichier 2014 étant lourd prenait un temps considérable pour tester les traitements.


BLOG BAO 1 et 2