Le projet
Objectif
Créer un nuage de mots à partir d'un corpus téléchargé sur le net.
Outils
Un script bash à écrire pour :
- Aspirer le contenu des urls
- Vérifier l'encodage des pages
- Réencoder si nécessaire
- Trouver les occurences d'un mot prédéfini
- En extraire le contexte
- Créer un tableau html contenant toutes les données