La vie multilingue de mot champagne
Tableaux
Le résultat de l'exécution de notre script est un tableau HTML dans lequel se sont trouvés de nombreux liens : les liens des URLs utilisées, des pages aspirées en HTML et en format textuel (txt), la fréquence du motif dans la page, l'encodage initial et les pages après le transcodage en UTF-8 . Nos fichiers d'URLs contenaient tous initialement plus de 50 liens. Cependant, lors de l'exécution du script, certaines pages Web n'apparaissent pas dans le tableau. Ce sont les pages auxquelles curl n'a pas pu accéder correctement (code HTTP différent de 200) ou celle dont le dump n'a pas pu être converti en UTF-8.
Il y un tableau pour chaque langue. Tableau ° 1 correspond à la langue russe, tableau ° 2 - l'anglais, tableau ° 3 - français.

Regarder le tableau interactif
~
Made on
Tilda