Les trois tableaux

Mon jeu de tableaux final s'organise en 9 colonnes :
  • N° de l'URL
  • Lien de l'URL
  • Lien vers la page aspirée
  • Retour curl
  • Dump en codage initial
  • Codage initial
  • Dump converti en UTF-8
  • Contextes au format .txt
  • Contextes au format .html
  • Nombre d'occurrences

Extraits des tableaux

Clic ici pour télécharger les tableaux complets.

tableaux de liens
Tableau de liens en anglais
URLPAGES ASPIREESRETOUR CURLDUMP INITIALCODAGE INITIALDUMP CONVERTICONTEXTES .txtCONTEXTES .htmlOCCURRENCES
3URL3PAGE ASPIREE3 0 DUMP-TEXT utf-8- 3.txt 3.html 5
4URL4PAGE ASPIREE4 0 DUMP-TEXT utf-8- 4.txt 4.html 1
5URL5PAGE ASPIREE5 0 DUMP-TEXT utf-8- 5.txt 5.html 1

tableaux de liens
Tableau de liens en français
URLPAGES ASPIREESRETOUR CURLDUMP INITIALCODAGE INITIALDUMP CONVERTICONTEXTES .txtCONTEXTES .htmlOCCURRENCES
34URL34PAGE ASPIREE34 0 DUMP-TEXT utf-8- 34.txt 34.html 20
35URL35PAGE ASPIREE35 0 DUMP-TEXT utf-8- 35.txt 35.html 12
36URL36PAGE ASPIREE36 0 DUMP-TEXT utf-8- 36.txt 36.html 13

tableaux de liens
Tableau de liens en japonais
URLPAGES ASPIREESRETOUR CURLDUMP INITIALCODAGE INITIALDUMP CONVERTICONTEXTES .txtCONTEXTES .htmlOCCURRENCES
16URL16PAGE ASPIREE16 0 DUMP-TEXT utf-8- 16.txt 16.html 8
17URL17PAGE ASPIREE17 0 DUMP-TEXT Shift_JIS DUMP UTF-8 17.txt 17.html 0
18URL18PAGE ASPIREE18 0 DUMP-TEXT Shift_JIS DUMP UTF-8 18.txt 18.html 0

Fichiers globaux

Ces fichiers ont été obtenus après concaténation des dumps et des contextes extraits dans la première partie du script. Ce sont les fichiers de contextes qui ont été utilisés pour réaliser les nuages. tableaux de liens
Contextes globaux en anglaisDumps globaux en anglais
Contextes globaux en françaisDumps globaux en français
Contextes globaux en japonaisDumps globaux en japonais