Programmation et projet encadré 2

Bienvenue !

Ce projet "boites à outils" (BàO) est réalisé dans le cadre du cours de Programmation et Projet Encadré. L'objectif étant de mettre en place une chaîne de traitement textuel semi-automatique qui permet de récupérer l'ensemble des fils RSS du Monde en 2019. Ainsi, nous ferons appel tout au long de ce projet à des différentes méthodes et outils informatiques nécessaires à la récupération du corpus, à la segmentation, à l'étiquetage, à l'extraction, et à la présentation des résultats.

Dans ce site, nous traiterons quatres rubriques du journal le Monde, à savoir: "A la une" (3208), "Europe" (3214), "Cinéma" (3476) et "Culture"(3546).

Nous avons choisi Perl pour réaliser les tâches du cours. Perl est un langage de programmation créé par Larry Wall en 1987 pour traiter facilement de l'information textuel. Il prend en charge les expressions régulières dans sa syntaxe, nous pouvons isoler des informations qui nous intéressent par les parenthèses.