Categories :

Liens

À propos de nous

Les étapes


diagram Notre travail a inclus plusieurs étapes qui ont formé la résolution à la fin.

1. URLS

D’abord on a réuni les informations sur le contexte du mot «blague» dans de différentes sources informationnelles. Plus précisement, on a retrouvé 50 URLS où l’on pouvait se heurter au mot «blague» pour chacune des langues travaillées. La recherche des pages web n’était pas aléatoire; l’objet de notre attention était plutôt la presse en ligne ou les sites web des blagues et des anecdotes.

2. Répertoires

L’étape importante qui nous a poussés à démarrer la partie informatique consistait à créer l’arborescence de travail avec tous les répertoires nécessaires où l’on allait stocker les résultats de notre travail petit à petit.

3. Aspiration

Ensuite nous avons écrit un script plus sérieux avec la commande "curl" qui nous permet d’aspirer les pages des URLS retrouvés et en même temps nous avons créer un tableau en format "html" pour stocker tous ces données. Ce tableau reste essentiel pour tout le travail et représente l’affichage du résultat de l’exécution de notre script.

4. Texte net

Nous avons élargi notre script en ajoutant la commande "lynx -dump -nolist", à l’aide de laquelle on a pu récupérer le texte seul de chaque URL sans référence. A cette étape-là nous avons trouvé et transformé également l’encodage de la page en UTF8 avec la commande display_charset=$encodage.

5. Contexte

Nous avons retrouvé le contexte du mot « blague » dans les trois langues en utilisant la commande "egrep".

6. Nuages

On a appliqué le contexte retrouvé sur des programmes divers comme Tagxedo ou Wordle pour pouvoir construire des nuages de mots. En outre, on a utilisé les programmes tel que TreeCloud et Le Trameur ou on a pu observer aussi de différentes manières de représentation les mots qui entourent nos mots clef.

7. Mise en ligne

Finalement, on a créé ce site que vous regardez en ce moment-là et qui vous propose la description des démarches principales de notre travail sur le mot.