Sujet : le mot 'contraception' (langues : Coréen, Espagnol, Arabe)

Le blog: script

Le blog: iTrameur

GitHub

Participants:


Tableau n° 1 (Fichier: url_es.txt )
Motifs: منع|حمل|피임|حبوب|anticoncepción|preservativo|anticonceptivos
URLCODE HTTPPAGE ASPIREEEncodageDUMP-TEXT
(UTF-8)
ContexteNombre
Motif
IndexBigramme
1 lien n°1 200 1_1 UTF-8 1_1 1_1 17 1_1 1_1
2 lien n°2 200 1_2 UTF-8 1_2 1_2 12 1_2 1_2
3 lien n°3 200 1_3 UTF-8 1_3 1_3 7 1_3 1_3
4 lien n°4 200 1_4 UTF-8 1_4 1_4 17 1_4 1_4
5 lien n°5 200 1_5 UTF-8 1_5 1_5 13 1_5 1_5
6 lien n°6 200 1_6 ISO-8859-15 1_6 1_6 11 1_6 1_6
7 lien n°7 200 1_7 ISO-8859-15 1_7 1_7 13 1_7 1_7
8 lien n°8 200 1_8 UTF-8 1_8 1_8 3 1_8 1_8
9 lien n°9 200 1_9 UTF-8 1_9 1_9 17 1_9 1_9
10 lien n°10 200 1_10 UTF-8 1_10 1_10 23 1_10 1_10
11 lien n°11 200 1_11 UTF-8 1_11 --- 0 1_11 1_11
12 lien n°12 200 1_12 UTF-8 1_12 1_12 17 1_12 1_12
13 lien n°13 200 1_13 UTF-8 1_13 1_13 7 1_13 1_13
14 lien n°14 000 --- --- --- --- --- --- ---
15 lien n°15 404 --- --- --- --- --- --- ---
16 lien n°16 200 1_16 UTF-8 1_16 1_16 12 1_16 1_16
17 lien n°17 200 1_17 UTF-8 1_17 1_17 10 1_17 1_17
18 lien n°18 200 1_18 UTF-8 1_18 1_18 19 1_18 1_18
19 lien n°19 200 1_19 UTF-8 1_19 1_19 9 1_19 1_19
20 lien n°20 200 1_20 UTF-8 1_20 1_20 6 1_20 1_20
21 lien n°21 200 1_21 UTF-8 1_21 1_21 8 1_21 1_21
22 lien n°22 200 1_22 UTF-8 1_22 1_22 2 1_22 1_22
23 lien n°23 200 1_23 UTF-8 1_23 1_23 5 1_23 1_23
24 lien n°24 200 1_24 UTF-8 1_24 1_24 10 1_24 1_24
25 lien n°25 404 --- --- --- --- --- --- ---
26 lien n°26 200 1_26 UTF-8 1_26 1_26 7 1_26 1_26
27 lien n°27 200 1_27 ISO-8859-1 1_27 1_27 6 1_27 1_27
28 lien n°28 200 1_28 UTF-8 1_28 1_28 2 1_28 1_28
29 lien n°29 200 1_29 UTF-8 1_29 1_29 28 1_29 1_29
30 lien n°30 200 1_30 UTF-8 1_30 1_30 1 1_30 1_30
31 lien n°31 200 1_31 UTF-8 1_31 1_31 6 1_31 1_31
32 lien n°32 200 1_32 UTF-8 1_32 1_32 25 1_32 1_32
33 lien n°33 200 1_33 UTF-8 1_33 1_33 7 1_33 1_33
34 lien n°34 200 1_34 UTF-8 1_34 1_34 1 1_34 1_34
35 lien n°35 200 1_35 UTF-8 1_35 1_35 6 1_35 1_35
36 lien n°36 200 1_36 UTF-8 1_36 1_36 11 1_36 1_36
37 lien n°37 200 1_37 UTF-8 1_37 1_37 7 1_37 1_37
38 lien n°38 200 1_38 UTF-8 1_38 1_38 12 1_38 1_38
39 lien n°39 403 --- --- --- --- --- --- ---
40 lien n°40 200 1_40 UTF-8 1_40 1_40 8 1_40 1_40
41 lien n°41 200 1_41 UTF-8 1_41 1_41 8 1_41 1_41
42 lien n°42 200 1_42 UTF-8 1_42 1_42 27 1_42 1_42
43 lien n°43 200 1_43 UTF-8 1_43 1_43 13 1_43 1_43
44 lien n°44 200 1_44 UTF-8 1_44 1_44 6 1_44 1_44
45 lien n°45 200 1_45 UTF-8 1_45 1_45 14 1_45 1_45
46 lien n°46 200 1_46 UTF-8 1_46 1_46 5 1_46 1_46
47 lien n°47 200 1_47 UTF-8 1_47 1_47 3 1_47 1_47
48 lien n°48 200 1_48 UTF-8 1_48 1_48 2 1_48 1_48
49 lien n°49 200 1_49 UTF-8 1_49 1_49 14 1_49 1_49
50 lien n°50 200 1_50 UTF-8 1_50 1_50 31 1_50 1_50


Tableau n° 2 (Fichier: urls_ar.txt )
Motifs: منع|حمل|피임|حبوب|anticoncepción|preservativo|anticonceptivos
URLCODE HTTPPAGE ASPIREEEncodageDUMP-TEXT
(UTF-8)
ContexteNombre
Motif
IndexBigramme
1 lien n°1 200 2_1 UTF-8 2_1 2_1 18 2_1 2_1
2 lien n°2 200 2_2 UTF-8 2_2 2_2 16 2_2 2_2
3 lien n°3 200 2_3 UTF-8 2_3 2_3 19 2_3 2_3
4 lien n°4 200 2_4 UTF-8 2_4 2_4 97 2_4 2_4
5 lien n°5 200 2_5 UTF-8 2_5 2_5 23 2_5 2_5
6 lien n°6 200 2_6 UTF-8 2_6 2_6 76 2_6 2_6
7 lien n°7 200 2_7 UTF-8 2_7 2_7 40 2_7 2_7
8 lien n°8 200 2_8 UTF-8 2_8 2_8 19 2_8 2_8
9 lien n°9 200 2_9 UTF-8 2_9 2_9 21 2_9 2_9
10 lien n°10 200 2_10 UTF-8 2_10 2_10 57 2_10 2_10
11 lien n°11 200 2_11 UTF-8 2_11 2_11 84 2_11 2_11
12 lien n°12 200 2_12 UTF-8 2_12 2_12 62 2_12 2_12
13 lien n°13 200 2_13 UTF-8 2_13 2_13 12 2_13 2_13
14 lien n°14 200 2_14 UTF-8 2_14 2_14 11 2_14 2_14
15 lien n°15 200 2_15 UTF-8 2_15 2_15 7 2_15 2_15
16 lien n°16 200 2_16 UTF-8 2_16 2_16 14 2_16 2_16
17 lien n°17 200 2_17 UTF-8 2_17 2_17 19 2_17 2_17
18 lien n°18 200 2_18 UTF-8 2_18 2_18 4 2_18 2_18
19 lien n°19 200 2_19 UTF-8 2_19 2_19 100 2_19 2_19
20 lien n°20 200 2_20 UTF-8 2_20 2_20 79 2_20 2_20
21 lien n°21 200 2_21 UTF-8 2_21 2_21 197 2_21 2_21
22 lien n°22 200 2_22 UTF-8 2_22 2_22 53 2_22 2_22
23 lien n°23 200 2_23 UTF-8 2_23 2_23 42 2_23 2_23
24 lien n°24 200 2_24 UTF-8 2_24 2_24 29 2_24 2_24
25 lien n°25 200 2_25 UTF-8 2_25 2_25 54 2_25 2_25
26 lien n°26 200 2_26 UTF-8 2_26 2_26 136 2_26 2_26
27 lien n°27 200 2_27 UTF-8 2_27 2_27 374 2_27 2_27
28 lien n°28 200 2_28 UTF-8 2_28 2_28 65 2_28 2_28
29 lien n°29 200 2_29 UTF-8 2_29 2_29 65 2_29 2_29
30 lien n°30 200 2_30 UTF-8 2_30 2_30 68 2_30 2_30
31 lien n°31 200 2_31 UTF-8 2_31 2_31 54 2_31 2_31
32 lien n°32 200 2_32 UTF-8 2_32 2_32 31 2_32 2_32
33 lien n°33 200 2_33 UTF-8 2_33 2_33 22 2_33 2_33
34 lien n°34 200 2_34 UTF-8 2_34 2_34 71 2_34 2_34
35 lien n°35 200 2_35 UTF-8 2_35 2_35 29 2_35 2_35
36 lien n°36 404 --- --- --- --- --- --- ---
37 lien n°37 200 2_37 UTF-8 2_37 2_37 47 2_37 2_37
38 lien n°38 200 2_38 UTF-8 2_38 2_38 27 2_38 2_38
39 lien n°39 200 2_39 UTF-8 2_39 2_39 40 2_39 2_39
40 lien n°40 200 2_40 UTF-8 2_40 2_40 23 2_40 2_40
41 lien n°41 200 2_41 UTF-8 2_41 2_41 7 2_41 2_41
42 lien n°42 200 2_42 UTF-8 2_42 2_42 18 2_42 2_42
43 lien n°43 200 2_43 UTF-8 2_43 2_43 103 2_43 2_43
44 lien n°44 200 2_44 UTF-8 2_44 2_44 120 2_44 2_44
45 lien n°45 200 2_45 UTF-8 2_45 2_45 146 2_45 2_45
46 lien n°46 200 2_46 UTF-8 2_46 2_46 225 2_46 2_46
47 lien n°47 200 2_47 UTF-8 2_47 2_47 175 2_47 2_47
48 lien n°48 200 2_48 UTF-8 2_48 2_48 137 2_48 2_48
49 lien n°49 200 2_49 UTF-8 2_49 2_49 320 2_49 2_49
50 lien n°50 200 2_50 UTF-8 2_50 2_50 113 2_50 2_50
51 lien n°51 200 2_51 UTF-8 2_51 2_51 18 2_51 2_51
52 lien n°52 200 2_52 UTF-8 2_52 2_52 18 2_52 2_52
53 lien n°53 200 2_53 UTF-8 2_53 2_53 92 2_53 2_53
54 lien n°54 200 2_54 UTF-8 2_54 --- 0 2_54 2_54
55 lien n°55 200 2_55 UTF-8 2_55 2_55 18 2_55 2_55
56 lien n°56 403 --- --- --- --- --- --- ---
57 lien n°57 200 2_57 UTF-8 2_57 2_57 113 2_57 2_57


Tableau n° 3 (Fichier: urls_ko.txt )
Motifs: منع|حمل|피임|حبوب|anticoncepción|preservativo|anticonceptivos
URLCODE HTTPPAGE ASPIREEEncodageDUMP-TEXT
(UTF-8)
ContexteNombre
Motif
IndexBigramme
1 lien n°1 200 3_1 EUC-KR 3_1 3_1 6 3_1 3_1
2 lien n°2 200 3_2 UTF-8 3_2 3_2 19 3_2 3_2
3 lien n°3 200 3_3 UTF-8 3_3 3_3 29 3_3 3_3
4 lien n°4 200 3_4 UTF-8 3_4 --- 0 3_4 3_4
5 lien n°5 200 3_5 UTF-8 3_5 3_5 24 3_5 3_5
6 lien n°6 200 3_6 UTF-8 3_6 3_6 51 3_6 3_6
7 lien n°7 200 3_7 UTF-8 3_7 3_7 11 3_7 3_7
8 lien n°8 200 3_8 UTF-8 3_8 3_8 39 3_8 3_8
9 lien n°9 200 3_9 UTF-8 3_9 3_9 28 3_9 3_9
10 lien n°10 200 3_10 UTF-8 3_10 3_10 57 3_10 3_10
11 lien n°11 200 3_11 UTF-8 3_11 3_11 54 3_11 3_11
12 lien n°12 200 3_12 UTF-8 3_12 3_12 32 3_12 3_12
13 lien n°13 200 3_13 UTF-8 3_13 3_13 39 3_13 3_13
14 lien n°14 200 3_14 UTF-8 3_14 3_14 33 3_14 3_14
15 lien n°15 200 3_15 EUC-KR 3_15 3_15 26 3_15 3_15
16 lien n°16 000 --- --- --- --- --- --- ---
17 lien n°17 200 3_17 UTF-8 3_17 3_17 33 3_17 3_17
18 lien n°18 200 3_18 UTF-8 3_18 3_18 21 3_18 3_18
19 lien n°19 200 3_19 UTF-8 3_19 3_19 32 3_19 3_19
20 lien n°20 200 3_20 UTF-8 3_20 3_20 70 3_20 3_20
21 lien n°21 200 3_21 UTF-8 3_21 3_21 53 3_21 3_21
22 lien n°22 200 3_22 UTF-8 3_22 3_22 105 3_22 3_22
23 lien n°23 200 3_23 UTF-8 3_23 3_23 21 3_23 3_23
24 lien n°24 200 3_24 UTF-8 3_24 3_24 8 3_24 3_24
25 lien n°25 200 3_25 UTF-8 3_25 3_25 20 3_25 3_25
26 lien n°26 200 3_26 UTF-8 3_26 3_26 30 3_26 3_26
27 lien n°27 200 3_27 UTF-8 3_27 3_27 24 3_27 3_27
28 lien n°28 200 3_28 UTF-8 3_28 3_28 42 3_28 3_28
29 lien n°29 200 3_29 UTF-8 3_29 3_29 20 3_29 3_29
30 lien n°30 405 --- --- --- --- --- --- ---
31 lien n°31 200 3_31 UTF-8 3_31 3_31 14 3_31 3_31
32 lien n°32 200 3_32 UTF-8 3_32 --- 0 3_32 3_32
33 lien n°33 200 3_33 UTF-8 3_33 3_33 16 3_33 3_33
34 lien n°34 200 3_34 UTF-8 3_34 3_34 6 3_34 3_34
35 lien n°35 200 3_35 UTF-8 3_35 3_35 5 3_35 3_35
36 lien n°36 200 3_36 EUC-KR 3_36 3_36 12 3_36 3_36
37 lien n°37 200 3_37 UTF-8 3_37 3_37 3 3_37 3_37
38 lien n°38 200 3_38 UTF-8 3_38 3_38 2 3_38 3_38
39 lien n°39 200 3_39 UTF-8 3_39 3_39 13 3_39 3_39
40 lien n°40 400 --- --- --- --- --- --- ---
41 lien n°41 200 3_41 UTF-8 3_41 3_41 3 3_41 3_41
42 lien n°42 200 3_42 EUC-KR 3_42 3_42 4 3_42 3_42
43 lien n°43 200 3_43 UTF-8 3_43 3_43 72 3_43 3_43
44 lien n°44 200 3_44 EUC-KR 3_44 3_44 67 3_44 3_44
45 lien n°45 200 3_45 UTF-8 3_45 --- 0 3_45 3_45
46 lien n°46 200 3_46 UTF-8 3_46 3_46 1 3_46 3_46
47 lien n°47 200 3_47 UTF-8 3_47 --- 0 3_47 3_47
48 lien n°48 200 3_48 UTF-8 3_48 3_48 9 3_48 3_48
49 lien n°49 200 3_49 UTF-8 3_49 --- 0 3_49 3_49
50 lien n°50 200 3_50 UTF-8 3_50 3_50 10 3_50 3_50