another page

Le projet

Objectif

Créer un nuage de mots à partir d'un corpus téléchargé sur le net.

Outils

Un script bash à écrire pour :

  • Aspirer le contenu des urls
  • Vérifier l'encodage des pages
  • Réencoder si nécessaire
  • Trouver les occurences d'un mot prédéfini
  • En extraire le contexte
  • Créer un tableau html contenant toutes les données