- Tableaux obtenus
Description des colonnes des tables (de gauche à droite) :
-
N° - Un compteur pour tous les URLs de chaque tableau
HTTP code - Réponse du serveur. 200 signifie que l'URL est accessible
Encodage d'origine - L'encodage d'origine du site source et donc de la page aspirée
URL - URL avec un lien cliquable qui renvoit vers le site source
Page aspirée - La page aspirée
Dump text - Dump du texte (en UTF-8)
Index - Un index répertoriant tous les mots du dump-text et leurs occurences trié par ordre décroissant
Bigramme - Même index mais avec des bigrammes
Contexte txt - Le contexte (les mots qui viennent avant et après) notre motif dans le dump du texte
Contexte html - Le contexte de notre motif dans le dump-text effectué par le programme 'minigrep'
CPT Motif - Le nombre d'occurrences de notre motif dans le dump-text
Rq : A la fin de chaque table, la concaténation des dump-texts et la concaténation des contextes de chaque langue
NB : Vous pouvez également retrouver les mêmes tableaux en page complète ici.