Présentation

Bienvenu sur la page regroupant les scripts perl et python réalisé dans le cadre de cours 'Projet Encadré', enseigné par M. Fleury et M. Magistry. Sur ce site vous pouvez retrouver le résultat de travail. Veuillez cliquer sur les images pour voir les boîtes à outils.

Conclusion

Ce projet nous a permis de découvrir la langage Perl, son syntaxe et ses possibilités en TAL. Nous avons pu le comparer aussi avec le langage Python. Premièrement, nous avons construit les scripts pour extraire les données des fils RSS. Ensuite nous avons ajouté les blocs de la tokenization et de l'étiquetage. Nous avons utilisé 2 outils différents: TreeTagger et UDPipe. Ce traitement produit les fichiers en formats .txt, .xml et udpipe (aussi xml). Finalement, nous avons pu observer les patrons et les relations de dépendance entre dans notre corpus et ce que j'ai trouvé intéressant c'est de les observer en graphe.

Après avoir effectué toutes ces manipulations je peux remarquer que le language Perl semble plus intuitif et plus ultime car il ne demande pas d'importation des modules pour faire des traitement simple à la différence de Python. En dehors de cela, pendant les cours nous avons determiné que Perl peut être plus efficace avec les expression régulière. Mais il a aussi ses défauts. Comme mentionné plus haut, Perl ne demande pas d'importation et cela veut dire que ses possibilités sont plus limitées que de Python.