SCRIPT - RUSSE
► Script principal
C'est à partir de ce script que le problème des URLs non UTF-8 a été réglé.
Le souci que nous avons eu avec le code était que la commande lynx ne connaît pas l’encodage CP1251.
Cet encodage est en effet Windows-1251. C’est pour cette raison que nous avons été obligées de rajouter
un test qui convertit l’encodage détecté en encodage nécessaire à l’aide de iconv.
-
Script principal pour le russe
► Script supplémentaire
Un petit script bash supplémentaire pour concaténer les fichiers contextes et les analyser :
-
Script concaténation russe