• Conclusions
  • Ce projet portait bien son nom de « boite à outils » : nous avons dû apprendre à gérer divers programmes à combiner entre eux. Nous sommes parties de blocs de code prédéfinis que nous avons dû tester et modifier en fonction de nos besoins. Nous avons également appris à utiliser des programmes préexistants (Treetagger, Cordial, Tokenise-utf.pl, bibliothèques Perl, …) qu’il nous fallait intégrer dans notre propre programme. Nous avons acquis les aptitudes élémentaires du langage Perl telles que la gestion des bibliothèques, l’organisation de l’entrée et de la sortie du programme, la gestion de boucles… . En définitive, nous avons trouvé ce projet fort intéressant et pourra s’avérer utile dans nos recherches futures..

  • Difficultés rencontrées
  • - Tout au long du semestre on testait nos programmes sur les fils RSS de 2008. Or, quand on a changé le corpus pour celui de 2011, on a trouvé que le format des données avait été modifié. De plus, dans le corpus "réel" de 2011, on a repéré plusieurs fichiers xml qui n'étaient pas en fait les fils RSS. Il a fallu prendre en compte ce facteur et poser plus de conditions de validation avant de traiter les fichiers d'entrée.

    - L'étiquetage des fichiers est couteux en temps, la BaO2, le programme central du projet, requiert donc plein de temps. Malheureusement, une faute mineure peut causer la coupure du fonctionnement du programme et on n'a pas appris à le rétablir après. Il était nécessaire de tout recommencer à chaque fois!

  • Remerciments
  • Nous tenons à remercier nos professeurs Jean-Michel Daube et Rachid Belmouhoub pour leurs précieux conseils, mais aussi et surtout notre Responsable de formation Mr. Serge Fleury pour sa disponibilité et sa patience.

  • Contacts
  • Charlène DENIS :
    charlenel.denis@gmail.com
    06.75.73.13.27

    Larisa NADEL :
    maive@yandex.ru
    07.61.99.45.62


 
 

Charlène DENIS & Larisa NADEL