✽ ✽ ✽

        Bonjour, bienvenue sur la page de l'analyse du corpus français!

✽ ✽ ✽


Dans cette partie, nous allons analyser la notion en français de notre mot clé "la notion de famille". Avant de commencer la partie d’analyse, nous pouvons d’abord interpréter notre mot clé : Notion de famille. Ce dernier a deux sens :

Nous pouvons prédire et faire des hypothèses sur les résultats que nous allons obtenir grâce à nos connaissances et à nos expériences : dans la culture française, au niveau linguistique, une famille est une communauté d’individus réunis par les liens de parenté existant dans toutes les sociétés humaines (selon wikipédia). Nous pouvons en déduire que la notion de famille contient la relation des membres internes de la famille, elle a un lien avec la vie quotidienne, et reflète quelques phénomènes sociaux. Nous allons vérifier notre hypothèse, c’est parti !


I. Étapes


Pour vérifier cette hypothèse, il faut suivre 4 étapes :

  1. Chercher 50 urls contenant notre mot clé "Notion de Famille"
  2. Écrire un script en bash et html pour télécharger les sites (en texte brut) et créer un tableau de résultat
  3. Prendre le texte brut en tant que corpus, analyser les résultats à l'aide de notre tableau et des outils d'analyse de textes
  4. Comparer les résultats avec l'hypothèse

II. Script


Veuillez cliquer ici pour télécharger le script, et ici pour télécharger le fichier de parametre.

III. Tableau final



>>> Veuillez cliquer pour télécharger le tableau final.


Corpus concaténé :


IV. Analyse


Avec notre script, nous obtenons enfin un beau tableau qui affiche les sites contenant notre motif et la fréquence, nous sommes presque arrivés à la fin ! Maintenant, nous allons analyser notre corpus. À noter que, le graphe ci-dessous est le résultat des cooccurrents du mot clé dans nos corpus français d'après le logiciel iTrameur.




Il s'agit de deux graphes, l'un concerne le mot famille au singulier, l'autre contient les coocurrents du mot famille au pluriel. En résumé, nous pouvons ranger tous ces mots fréquents dans les classes ci-dessous :

  • sens absolu : définition, notion

  • sociologie : sociologie, traditionnelle, contemporaine, droit

  • dimension : monoparentale, nombreuse, élargie, étendues

  • construction et membre : sein, membres, père, mère, groupe

  • phénomènes et problèmes sociaux : conjugale, imbriquée, recomposée, monoparentale, homoparentales, disputent



Pour faciliter et représenter plus intuitivement notre résultat, il est intéressant de montrer un nuage de mots, comme ci-dessous :



Pour le résultat final, veuillez consulter la rubrique "Résultats".









  1. Étapes
  2. Script
  3. Tableau final
  4. Analyse