Etude de la relation 'objet' pour les rubriques Europe, France et International
On réutilise le script de la BaO3/python pour l'extraction de la relation objet. Cependant, on va envoyer les résultats (avec la fonciton print()) vers le site padagraph. Cela va nous permettre de visualiser cette relation plus simplement.
J'ai également pris les lemmes plutôt que les formes pour le graphe. J'ai également compté les occurrences de chaque relations pour donner une importance plus importantes aux relations ayant une occurrence plus importante. Pour chaque rubrique, je me suis concentrée sur le dépendant "DROIT" et ses différents gouverneurs.
Je reprends la même commande que pour le script de la BaO3/python en redirigeant la sortie vers le site grâce à curl -X. J'ai lancé le script pour mes trois rubriques, afin de comparer mes relations objets.
On envoie trois sorties avec print(). Une pour les gouverneurs, une pour les dépendants et une dernière pour la relation objet. Cela va créer un fichier au format .csv.
Voici ce que l'on obtient quand on lance le script et qu'on redirige la sortie vers le site padagraph
Cela n'est pas très lisible. Nous allons nous concentré sur le lemme "DROIT" et ses gourverneurs.
Voici le graphe pour la rubrique FRANCE. On a 4020 noeuds et 6825 relations.
Télécharger la liste des gouverneurs du lemme "DROIT" ici
Voici le graphe pour la rubrique EUROPE. On a 3080 noeuds et 5468 relations.
Télécharger la liste des gouverneurs du lemme "DROIT" ici
Voici le graphe pour la rubrique INTERNATIONAL. On a 4020 noeuds et 6825 relations.
Télécharger la liste des gouverneurs du lemme "DROIT" ici
En utilisant la commande suivante : "egrep -i -o "\b\w.+\b" liste_dep_droit.txt |sort | uniq -c | sort -nr" sur le document qui réunit les gouverneurs du lemme "DROIT" des trois rubriques, on obtient comme résultat une liste des gouverneurs ordonnés par occurrence. S'ils apparaissent trois fois, c'est que la relation GOV-[obj]->DROIT est commune aux trois rubiques. Le résultat se trouve ici
Les gouverneurs communs aux trois rubriques sont les suivants : obtenir, mettre, défendre, donner, avoir et concerner