Objectif et étapes de réalisation de notre projet
Objectif : rédiger un programme bash d'extraction de pages Web afin de constituer un corpus de texte multilingue autour d'un thème ou d'une expression
Étape 1 : choix d'une liste d'URL dans 5 langues (Corpus)
Étape 2 : création d'un script d'extraction automatique de pages Web et de génération de corpus (Script)
Étape 3 : analyse des corpus générés (Tableau et Résultats)
Le détail des étapes de l'élaboration du script sont détaillées sur le blog de notre projet : Posthumanblog