murgerb glux

En quelques phrases

Nous avons élaboré ce site pour rendre compte du travail que nous avons réalisé dans le cadre du « Cours de Programmation et Projet encadré » assuré par Serge Fleury (Paris 3), Jean-Michel Daube (Inalco) et Rachid Belmouhoub (Inalco). Vous pourrez par ailleurs retrouver les prémices de ce projet, les exercices et notes de cours dans le blog que nous avons rempli au fil du semestre (accéder au blog).


Dans le cadre de ce projet encadré, nous avons dans un premier temps choisi un mot puis déterminé sont équivalent dans nos différentes langues de travail. Nous avons ensuite intuitivement recherche des pages internet traitant du thème que nous avions choisi. Nous avons ensuite constitué étape par étape un script nous permettant d’automatiser l’aspiration des URLs, leur stockage, la vérification de leur encodage, pour certaines la conversion de leur encodage, la recherche de notre motif et le stockage des résultats dans des tableaux récapitulatifs. L’étape finale de première phase du projet était la réalisation de nuages de mots et d’analyses texto-métriques avec le logiciel trameur.


Nous avons travaillé sur langues, l’arménien, le français, l’hindi, l’indonésien et le russe. C’est sur le mot « athée » en français que notre choix s’est arrêter. Les contextes culturels, socio-politiques, historiques, le rapport à la religion étant variés, nous espérions aboutir à des résultats tout aussi variés. La chasse aux mots « աթեիստ » en arménien, « ateis » ou « atheis » en indonésien, « athée » en français, « नास्तिक » en hindi et « атеи » en russe était ouverte.


En parcourant les différentes rubriques de ce site, vous pourrez suivre les différentes étapes de notre projet, voir quelques-uns des problèmes auxquels nous avons été confrontés, ainsi qu’un échantillon des résultats auxquels nous avons abouti.