Dans cette partie, nous trouverons deux sous ensembles :
Le corpus constituer des fichiers d'URLs de nos trois langues