Le résultat de l'exécution de notre script est un tableau HTML dans lequel se sont trouvés de nombreux liens : les liens des URLs utilisées, des pages aspirées en HTML et en format textuel (txt), la fréquence du motif dans la page,
l'encodage initial et les
pages après le transcodage en UTF-8 . Nos fichiers d'URLs contenaient tous initialement plus de 50 liens. Cependant, lors de l'exécution du script, certaines pages Web n'apparaissent pas dans le tableau. Ce sont les pages auxquelles
curl n'a pas pu accéder correctement (code HTTP différent de 200) ou celle dont le dump n'a pas pu être converti en UTF-8.
Il y un tableau pour chaque langue. Tableau ° 1 correspond à la langue russe, tableau ° 2 - l'anglais, tableau ° 3 - français.
Regarder le tableau interactif