Objectif et étapes de réalisation de notre projet

Objectif : rédiger un programme bash d'extraction de pages Web afin de constituer un corpus de texte multilingue autour d'un thème ou d'une expression

Étape 1 : choix d'une liste d'URL dans 5 langues (Corpus)

Étape 2 : création d'un script d'extraction automatique de pages Web et de génération de corpus (Script)

Étape 3 : analyse des corpus générés (Tableau et Résultats)

Le détail des étapes de l'élaboration du script sont détaillées sur le blog de notre projet : Posthumanblog