Accueil

Dans le cadre du Master 1 Traitement automatique des langues co-habilité par l’Inalco, l’Université Sorbonne Nouvelle et l’Université Paris Nanterre, un projet encadré "Boîte à outils" est proposé.

Le projet Boîte à Outils (BàO) consiste à la mise en oeuvre d'une chaîne de traitement textuel semi-automatique, depuis la récupération des données jusqu'à leur présentation. Les boîtes à outils font appel aux méthodes informatiques suivantes:

  • Boîte à outils 1: extraction du texte


  • Boîte à outils 2: étiquetage du texte


  • Boîte à outils 3: extraction de patrons


  • Le projet en schéma:

    Le corpus de travail est constitué de l'ensemble des fils RSS disponibles sur le site du journal Le Monde recueillis tous les jours de l'année 2020 à 19h. Les rubriques choisies sont: 3476 cinema , 3246 culture et 3546 voyage.