Conclusion

Lors de ce projet, j'ai pu découvrir et me familiariser avec le langage Perl et comprendre comment parcourir une arborescence entière afin de traiter chaque fichier. En plus, j'ai pu également comparer la performance des deux étiqueteurs et se rendre compte que tout le projet reposait en réalité sur ces étiquetages. On a remarqué que le Talismane est un outil plus performant que le Tree-Tagger, puisqu'on avait besoin un script pour la bonne segmentation du corpus traité par TreeTagger. Et les résultats de Talismane contenaient plus d'informations d'un mot, telles que la dépendances, le genre et la personne. Cependant, l'outil Talismane a prise plus de temps de calculer alors que le TreeTagger était plus rapide.

Les résultats de patron morposyntaxique sont intéressant. En ce qui est montré dans le patron NOM ADJ des rubrique A la une 3208 et Culture 3246, un des bigrammes les plus fréquents est "gilets jaunes", ce qui montre que ce movement préoccupe les gens le plus pour l'année 2019.