Accueil | BàO 1 | BàO 2 | BàO 3 | BàO 4 | Conclusion

Conclusion BàO1-2

Perl est un langage plutôt complexe de mon point de vue, j'ai eu un peu de mal à m'y habituer pendant ce semestre. Certes, certaines choses sont plus facile à faire avec ce langage, mais le fait qu'il y ai des variables différentes m'a beaucoup perturbée... même si cela s'avère être un des points positifs de ce langage.

Par rapport à l'utilisation de Tree-tagger et Talismane, je retiendrai surtout le fait que Talismane est très long à tourner. Il y a certes des résultats plus corrects en utilisant cet étiqueteur, mais si il faut traiter un court texte en peu de temps, je me tournerai vers Tree-tagger. J'ai eu pas mal de problèmes pour faire tourner Talismane correctement, alors mon avis est sans doute biaisé par ces difficultés!

Pour avoir observé les fichiers taggés cependant, Talismane parait être plus rigoureux sur certaines étiquettes que Tree-Tagger.

Je concluerai donc en disant que si vous devez tagger un fichier en peu de temps, Tree-tagger peut faire l'affaire. Mais si vous êtes prêts à laisser tourner votre machine toute une nuit sur un lourd fichier, Talismane est un bon choix.

Conclusion BàO3

J'ai préféré travailler avec XQuery pour l'extraction de patrons. En effet, j'ai pensé que cette méthode était plus intuitive, plus logique. De plus, l'interface BaseX est plutôt pratique, et une fois le logiciel maitrisé, c'est un jeu d'enfant que de soumettre des requêtes. La syntaxe de ces requêtes ressemble quelque peu à la syntaxe SQL, un autre langage de requêtes que j'ai eu plaisir à étudier ce premier semestre.

Conclusion BàO4

Je me suis concentrée sur deux mots spécifiques pour la mise en graphe: politique et mort. Le mot "mort" vient d'une hypothèse que j'avais en tête au début du projet, comme quoi la rubrique Livres contiendrait ce mot un grand nombre de fois. J'ai été étonnemment surprise de voir qu'il revenait beaucoup dans les trois rubriques, et surtout dans la rubrique Idées. Pour le mot politique, l'idée m'est venue en regardant les résultats de la rubrique Idées. Etrangement, je pensais que cette rubrique contiendrait plutôt des choses comme des idées artistiques. J'ai été bien surprise de voir autant de politique!

Partant de ces motifs, j'ai donc fait quelques analyses que vous pouvez retrouver dans la BàO4. Je tiens à finir en disant que ce projet m'a beaucoup appris, et j'ai aimé faire des analyses sur la langue en elle-même.

Bref

Ce projet nous a permis de comprendre l'importance des données structurées, et j'ai trouvé cela très enrichissant. Je tiens à remercier nos professeurs, Serge FLEURY et Jean-Michel DAUBE, pour leur aide précieuse et leur patience face aux nombreux problèmes que j'ai pu rencontrer!