Présentation du projet


L'objectif était de permettre un traitement semi-automatique sur un ou plusieurs textes. J'ai choisi d'étudier le mot "plante" en anglais, en français et en turc pour voir leurs utilisations dans différents contextes.

J'ai choisi une trentaine d'urls dans chaque langue qui contiennent le mot en question.

Ensuite, avec les outils comme lynx, curl et egrep, et après avoir installé le minigrepmultilinque, j'ai extrait les textes, les convertir en UTF-8 dans les cas où cela fonctionnait, et j'ai pu faire des recherches dans le contexte des mots.

Ensuite, j'ai créé le site Internet. Tous les documents se trouvent dans le dossier qui accompagne ce site.

Ce projet m'a permis d'améliorer mes compétences en programmation, notamment en Bash, et ça m'a également permis de voir comment fonctionnait un programme codé sous Perl.

Lors du choix des liens, je ne me suis pas restreinte, il existe des pages des journaux tout comme des blogs ou des sites commerciaux...

Quant a la constitution des nuages, j'ai utilisé l'outil en ligne Wordle pour créer un nuage pour chaque langue.