Choix du terme
Le thème générique auquel nous avions pensé était « politique » où nous avions, dans une discussion triviale, pioché le mot féminisme. Nous pensons effectivement que ce sujet gagne de la place, de plus en plus, dans les sociétés occidentales. En France notamment ce mouvement devient une question majeur dans le développement de la société culturellement, pour tous ceux qui militent pour l’égalité entre les hommes et les femmes. Ces intellectuelles, penseurs, hommes et femmes politiques, entre favorables et défavorables, ont mis sur la table courageusement ce débat perpétuel, dans l’espoir éventuellement d’abolir les inégalités entre les individus. Entre débat d’idées et polémiques, le féminisme de France serait-il le même ailleurs ? En chine ? Dans le monde arabo-musulman ? Le mot féminisme a-t-il la même définition dans les différentes langues ? Dans quels contextes sociolinguistique on retrouverait ce terme ? Peut-il véhiculer une philosophie spécifique et/ou multiples en fonction d’une langue donnée, dans une sphère culturelle donnée, dans une société dominée par une religion quelconque sinon l’absence de religion.
Script
Le script nous permet de générer les tableaux que nous aurons besoin pour l'analyse textométrique. Le script se déroule ainsi: D'abord lire depuis un fichier les listes d'URL, ensuite aspirer des pages associées aux URL avec 'curl', trouver l'encodage de ces pages, si l'encodage n'est pas utf-8, le convertir, prochainement chercher le contexte de notre terme dans le dump du texte brut, utiliser le programme 'minigrep' pour chercher aussi les contextes, mettre le tout dans des cellules différentes d'un tableau, refaire dans la boucle.
Pour voir le script: cliquer ici
Analyse textométrique
"Le Trameur est un programme d’analyse comportant de nombreuses fonctionnalités pour l’analyse automatique, statistique et documentaire de textes en vue de leur profilage sémantique, thématique et de leur interprétation. Ce logiciel est à l’origine un outil de textométrie : il intègre les fonctionnalités classiques de ce type d’outils dans ce domaine. Il dispose aussi des fonctionnalités particulières qui permettent d’annoter dynamiquement des corpus ou d’explorer des ressources richement annotées (treebanks monolingues/multilingues ou des alignements)." Voici le site officiel du Trameur
Nuage et site final
Le nuage de mots est une façon simple de cartographier des idées, des champs sémantiques, des concepts, d’évoquer des notions essentielles. Concrètement cet outil permet de faire une analyse sémantique textuelle, c'est à dire mettre en exergue la fréquence d'usage d'un mot-clé dans ce même texte ou page.
Son efficacité dépend autant de la forme (grandeur du nuage, finesse des variations de taille et de couleur) que du contenu (pertinence des mots clés évoqués, signification concrète).
Pour la création des nuages, voici des outils disponibles en ligne: Tagul, Wordcloud, Wordle, Worditout, Treecloud et Tagcrowd.
Il faut remarquer que l’adaptation de ces logiciels de différentes langues est encore limitée. Après notre découverte, nous vous recommandons
Tagul qui est beaucoup plus complexe que les autres, mais il marche très bien en français, en arabe et en chinois. Une fois que vous l’avez pris en main, vous pouvez réaliser des magnifiques formes géométriques.