Paix
Peace
Accueil
Presentation
Script
Tableaux
Nuages
Conclusion
Je suis un étudiant en M1 Ingénierie Linguistique à l'INALCO: M.MOULAY Sidi Mohammed.
Mon choix s'est porté sur le mot 'Paix' en Français et en Anglais.
Ce choix était principalement aléatoire.
les étapes du projet
Première étape
J'ai sélectionné le mot "Paix" car il est d'actualité et aussi polysémique. Nous avons pris 20 urls contenant ce mot dans les deux langues.
Deuxième étape
J'ai utilisé la commande wget afin de stocker les pages aspirées.
Troisième étape
Grâce à la commande Lynx j'ai voulu extraire le texte uniquement pour transformer les fichiers HTML en fichiers textes c-à-d sans balises HTML.
Quatrième étape
La quatrième étape consiste à utiliser la commande egrep Celle-ci permet de chercher les lignes contenant le mot en question.
Cinquième étape
J'ai installé minigrepmultilingue pour convertir les fichiers de la quatrième étape en contexte au format html.
Sixième étape
Création du site internet.
© 2013
Paix
. M. MOULAY Sidi Mohammed.