Projet Master TAL

Les Tableaux:

Pour classer les résultats, on a créé pour chaque langue un tableau en HTML; à l’intérieur de notre script bash.

Voici les deux tableaux:

Encodage
via CURL
Encodage
extrait
http_codeURLPAGES-ASPIREESDUMP initialDUMP-TEXT-utf8CONTEXTE UTF-8CONTEXTE HTMLIndexFq MOTIF
1UTF-8-200lien 1 page aspirée 1-1 - DP 1-1-utf8 contexte 1-1 contexte 1-1 Index 1-1 84
3UTF-8-200lien 3 page aspirée 1-3 - DP 1-3-utf8 contexte 1-3 contexte 1-3 Index 1-3 33
4UTF-8-200lien 4 page aspirée 1-4 - DP 1-4-utf8 contexte 1-4 contexte 1-4 Index 1-4 16
5UTF-8-200lien 5 page aspirée 1-5 - DP 1-5-utf8 contexte 1-5 contexte 1-5 Index 1-5 24
6UTF-8-200lien 6 page aspirée 1-6 - DP 1-6-utf8 contexte 1-6 contexte 1-6 Index 1-6 19
7UTF-8-400lien 7 page aspirée 1-7 - DP 1-7-utf8 contexte 1-7 contexte 1-7 Index 1-7 10
8UTF-8-404lien 8 page aspirée 1-8 - DP 1-8-utf8 contexte 1-8 contexte 1-8 Index 1-8 22
10UTF-8-200lien 10 page aspirée 1-10 - DP 1-10-utf8 contexte 1-10 contexte 1-10 Index 1-10 22
11UTF-8-200lien 11 page aspirée 1-11 - DP 1-11-utf8 contexte 1-11 contexte 1-11 Index 1-11 23
12UTF-8-200lien 12 page aspirée 1-12 - DP 1-12-utf8 contexte 1-12 contexte 1-12 Index 1-12 5
13UTF-8-200lien 13 page aspirée 1-13 - DP 1-13-utf8 contexte 1-13 contexte 1-13 Index 1-13 10
14UTF-8-200lien 14 page aspirée 1-14 - DP 1-14-utf8 contexte 1-14 contexte 1-14 Index 1-14 131
15UTF-8-200lien 15 page aspirée 1-15 - DP 1-15-utf8 contexte 1-15 contexte 1-15 Index 1-15 5
16UTF-8UTF-8UTF-8200lien 16 page aspirée 1-16 - DP 1-16-utf8 contexte 1-16 contexte 1-16 Index 1-16 10
17UTF-8-404lien 17 page aspirée 1-17 - DP 1-17-utf8 contexte 1-17 contexte 1-17 Index 1-17 1
18UTF-8-200lien 18 page aspirée 1-18 - DP 1-18-utf8 contexte 1-18 contexte 1-18 Index 1-18 15
19UTF-8-200lien 19 page aspirée 1-19 - DP 1-19-utf8 contexte 1-19 contexte 1-19 Index 1-19 2
20UTF-8200lien 20 page aspirée 1-20 - DP 1-20-utf8 contexte 1-20 contexte 1-20 Index 1-20 6
22UTF-8-200lien 22 page aspirée 1-22 - DP 1-22-utf8 contexte 1-22 contexte 1-22 Index 1-22 14
23UTF-8-200lien 23 page aspirée 1-23 - DP 1-23-utf8 contexte 1-23 contexte 1-23 Index 1-23 38
24US-ASCII-400lien 24 page aspirée 1-24 DP 1-24 DP 1-24-utf8 contexte 1-24 contexte 1-24 Index 1-24 0
25UTF-8-200lien 25 page aspirée 1-25 - DP 1-25-utf8 contexte 1-25 contexte 1-25 Index 1-25 15
26UTF-8-200lien 26 page aspirée 1-26 - DP 1-26-utf8 contexte 1-26 contexte 1-26 Index 1-26 12
27UTF-8-200lien 27 page aspirée 1-27 - DP 1-27-utf8 contexte 1-27 contexte 1-27 Index 1-27 5
28UTF-8-200lien 28 page aspirée 1-28 - DP 1-28-utf8 contexte 1-28 contexte 1-28 Index 1-28 21
30UTF-8UTF-8UTF-8200lien 30 page aspirée 1-30 - DP 1-30-utf8 contexte 1-30 contexte 1-30 Index 1-30 8
32UTF-8-200lien 32 page aspirée 1-32 - DP 1-32-utf8 contexte 1-32 contexte 1-32 Index 1-32 9
33UTF-8-200lien 33 page aspirée 1-33 - DP 1-33-utf8 contexte 1-33 contexte 1-33 Index 1-33 0
34UTF-8-200lien 34 page aspirée 1-34 - DP 1-34-utf8 contexte 1-34 contexte 1-34 Index 1-34 1
35UTF-8-200lien 35 page aspirée 1-35 - DP 1-35-utf8 contexte 1-35 contexte 1-35 Index 1-35 7
36UTF-8-200lien 36 page aspirée 1-36 - DP 1-36-utf8 contexte 1-36 contexte 1-36 Index 1-36 19
37UTF-8-200lien 37 page aspirée 1-37 - DP 1-37-utf8 contexte 1-37 contexte 1-37 Index 1-37 8
38UTF-8-200lien 38 page aspirée 1-38 - DP 1-38-utf8 contexte 1-38 contexte 1-38 Index 1-38 11
39UTF-8-200lien 39 page aspirée 1-39 - DP 1-39-utf8 contexte 1-39 contexte 1-39 Index 1-39 38
41UTF-8-200lien 41 page aspirée 1-41 - DP 1-41-utf8 contexte 1-41 contexte 1-41 Index 1-41 0
42UTF-8-200lien 42 page aspirée 1-42 - DP 1-42-utf8 contexte 1-42 contexte 1-42 Index 1-42 0
43UTF-8-200lien 43 page aspirée 1-43 - DP 1-43-utf8 contexte 1-43 contexte 1-43 Index 1-43 6
44WINDOWS-1256-200lien 44 page aspirée 1-44 DP 1-44 DP 1-44-utf8 contexte 1-44 contexte 1-44 Index 1-44 0
45UTF-8UTF-8UTF-8200lien 45 page aspirée 1-45 - DP 1-45-utf8 contexte 1-45 contexte 1-45 Index 1-45 0
46UTF-8-200lien 46 page aspirée 1-46 - DP 1-46-utf8 contexte 1-46 contexte 1-46 Index 1-46 6
47UTF-8-200lien 47 page aspirée 1-47 - DP 1-47-utf8 contexte 1-47 contexte 1-47 Index 1-47 7
48UTF-8-200lien 48 page aspirée 1-48 - DP 1-48-utf8 contexte 1-48 contexte 1-48 Index 1-48 12
49UTF-8-200lien 49 page aspirée 1-49 - DP 1-49-utf8 contexte 1-49 contexte 1-49 Index 1-49 15
50UTF-8-200lien 50 page aspirée 1-50 - DP 1-50-utf8 contexte 1-50 contexte 1-50 Index 1-50 9

Encodage
via CURL
Encodage
extrait
http_codeURLPAGES-ASPIREESDUMP initialDUMP-TEXT-utf8CONTEXTE UTF-8CONTEXTE HTMLIndexFq MOTIF
1UTF-8-200lien 1 page aspirée 2-1 - DP 2-1-utf8 contexte 2-1 contexte 2-1 Index 2-1 416
2UTF-8-200lien 2 page aspirée 2-2 - DP 2-2-utf8 contexte 2-2 contexte 2-2 Index 2-2 43
3UTF-8-200lien 3 page aspirée 2-3 - DP 2-3-utf8 contexte 2-3 contexte 2-3 Index 2-3 32
4UTF-8-200lien 4 page aspirée 2-4 - DP 2-4-utf8 contexte 2-4 contexte 2-4 Index 2-4 50
5ISO-8859-1UTF-8UTF-8200lien 5 page aspirée 2-5 - DP 2-5-utf8 contexte 2-5 contexte 2-5 Index 2-5 46
6ISO-8859-1UTF-8UTF-8200lien 6 page aspirée 2-6 - DP 2-6-utf8 contexte 2-6 contexte 2-6 Index 2-6 24
7UTF-8-200lien 7 page aspirée 2-7 - DP 2-7-utf8 contexte 2-7 contexte 2-7 Index 2-7 14
8UTF-8-200lien 8 page aspirée 2-8 - DP 2-8-utf8 contexte 2-8 contexte 2-8 Index 2-8 11
9ISO-8859-1UTF-8UTF-8200lien 9 page aspirée 2-9 - DP 2-9-utf8 contexte 2-9 contexte 2-9 Index 2-9 24
10UTF-8-200lien 10 page aspirée 2-10 - DP 2-10-utf8 contexte 2-10 contexte 2-10 Index 2-10 0
11UTF-8-200lien 11 page aspirée 2-11 - DP 2-11-utf8 contexte 2-11 contexte 2-11 Index 2-11 15
12UTF-8-200lien 12 page aspirée 2-12 - DP 2-12-utf8 contexte 2-12 contexte 2-12 Index 2-12 191
13WINDOWS-1252200lien 13 page aspirée 2-13 DP 2-13 DP 2-13-utf8 contexte 2-13 contexte 2-13 Index 2-13 44
14UTF-8200lien 14 page aspirée 2-14 - DP 2-14-utf8 contexte 2-14 contexte 2-14 Index 2-14 33
15UTF-8-200lien 15 page aspirée 2-15 - DP 2-15-utf8 contexte 2-15 contexte 2-15 Index 2-15 19
16UTF-8-200lien 16 page aspirée 2-16 - DP 2-16-utf8 contexte 2-16 contexte 2-16 Index 2-16 4
17ISO-8859-1-200lien 17 page aspirée 2-17 DP 2-17 DP 2-17-utf8 contexte 2-17 contexte 2-17 Index 2-17 0
18UTF-8-200lien 18 page aspirée 2-18 - DP 2-18-utf8 contexte 2-18 contexte 2-18 Index 2-18 34
20UTF-8-200lien 20 page aspirée 2-20 - DP 2-20-utf8 contexte 2-20 contexte 2-20 Index 2-20 10
21UTF-8-200lien 21 page aspirée 2-21 - DP 2-21-utf8 contexte 2-21 contexte 2-21 Index 2-21 5
22UTF-8-200lien 22 page aspirée 2-22 - DP 2-22-utf8 contexte 2-22 contexte 2-22 Index 2-22 37
23ISO-8859-1UTF-8UTF-8200lien 23 page aspirée 2-23 - DP 2-23-utf8 contexte 2-23 contexte 2-23 Index 2-23 0
24WINDOWS-1252200lien 24 page aspirée 2-24 DP 2-24 DP 2-24-utf8 contexte 2-24 contexte 2-24 Index 2-24 4
25UTF-8-200lien 25 page aspirée 2-25 - DP 2-25-utf8 contexte 2-25 contexte 2-25 Index 2-25 8
26UTF-8-200lien 26 page aspirée 2-26 - DP 2-26-utf8 contexte 2-26 contexte 2-26 Index 2-26 71
27UTF-8-200lien 27 page aspirée 2-27 - DP 2-27-utf8 contexte 2-27 contexte 2-27 Index 2-27 10
28UTF-8-200lien 28 page aspirée 2-28 - DP 2-28-utf8 contexte 2-28 contexte 2-28 Index 2-28 14
29UTF-8-200lien 29 page aspirée 2-29 - DP 2-29-utf8 contexte 2-29 contexte 2-29 Index 2-29 22
30UTF-8-200lien 30 page aspirée 2-30 - DP 2-30-utf8 contexte 2-30 contexte 2-30 Index 2-30 24
31UTF-8-200lien 31 page aspirée 2-31 - DP 2-31-utf8 contexte 2-31 contexte 2-31 Index 2-31 5
32UTF-8-200lien 32 page aspirée 2-32 - DP 2-32-utf8 contexte 2-32 contexte 2-32 Index 2-32 29
33UTF-8-200lien 33 page aspirée 2-33 - DP 2-33-utf8 contexte 2-33 contexte 2-33 Index 2-33 29
34UTF-8-200lien 34 page aspirée 2-34 - DP 2-34-utf8 contexte 2-34 contexte 2-34 Index 2-34 15
35UTF-8UTF-8UTF-8200lien 35 page aspirée 2-35 - DP 2-35-utf8 contexte 2-35 contexte 2-35 Index 2-35 9
36UTF-8-200lien 36 page aspirée 2-36 - DP 2-36-utf8 contexte 2-36 contexte 2-36 Index 2-36 57
37UTF-8-200lien 37 page aspirée 2-37 - DP 2-37-utf8 contexte 2-37 contexte 2-37 Index 2-37 7
38UTF-8-200lien 38 page aspirée 2-38 - DP 2-38-utf8 contexte 2-38 contexte 2-38 Index 2-38 228
39UTF-8-200lien 39 page aspirée 2-39 - DP 2-39-utf8 contexte 2-39 contexte 2-39 Index 2-39 185
40UTF-8-200lien 40 page aspirée 2-40 - DP 2-40-utf8 contexte 2-40 contexte 2-40 Index 2-40 6
41UTF-8-200lien 41 page aspirée 2-41 - DP 2-41-utf8 contexte 2-41 contexte 2-41 Index 2-41 22
42UTF-8-200lien 42 page aspirée 2-42 - DP 2-42-utf8 contexte 2-42 contexte 2-42 Index 2-42 23
43UTF-8-200lien 43 page aspirée 2-43 - DP 2-43-utf8 contexte 2-43 contexte 2-43 Index 2-43 44
44UTF-8-200lien 44 page aspirée 2-44 - DP 2-44-utf8 contexte 2-44 contexte 2-44 Index 2-44 37
45UTF-8-200lien 45 page aspirée 2-45 - DP 2-45-utf8 contexte 2-45 contexte 2-45 Index 2-45 37
46UTF-8-200lien 46 page aspirée 2-46 - DP 2-46-utf8 contexte 2-46 contexte 2-46 Index 2-46 53
47UTF-8-200lien 47 page aspirée 2-47 - DP 2-47-utf8 contexte 2-47 contexte 2-47 Index 2-47 0
48UTF-8-200lien 48 page aspirée 2-48 - DP 2-48-utf8 contexte 2-48 contexte 2-48 Index 2-48 66
49ISO-8859-1-200lien 49 page aspirée 2-49 DP 2-49 DP 2-49-utf8 contexte 2-49 contexte 2-49 Index 2-49 0
50UTF-8-200lien 50 page aspirée 2-50 - DP 2-50-utf8 contexte 2-50 contexte 2-50 Index 2-50 25
51UTF-8-200lien 51 page aspirée 2-51 - DP 2-51-utf8 contexte 2-51 contexte 2-51 Index 2-51 48
52WINDOWS-1252200lien 52 page aspirée 2-52 DP 2-52 DP 2-52-utf8 contexte 2-52 contexte 2-52 Index 2-52 191
53UTF-8-200lien 53 page aspirée 2-53 - DP 2-53-utf8 contexte 2-53 contexte 2-53 Index 2-53 27
54WINDOWS-1252200lien 54 page aspirée 2-54 DP 2-54 DP 2-54-utf8 contexte 2-54 contexte 2-54 Index 2-54 21