Boîte à Outils 4
Objectif: à partir des patrons qu'on a extrait, on doit réaliser un graphe. Je vais donc utiliser le programme patron2graphml.exe qui prend en entrée un encodage UTF-8 (argument 0), une liste des patrons (argument 1), et un motif (argument 2 est optionnel):
- Pour afficher tous les noeuds du graphe :
patron2graphe.exe "encodage" patrons.txt - Pour afficher uniquement des nœuds obtenus par filtrage préalable du motif dans les patrons :
patron2graphe.exe "encodage" patrons.txt motif-encodage.txt
Graphes
Je cherche à savoir dans quel contexte les prépositions sont produits. Mais, avant de commencer j'ai fait des hypothèses:- le motif \bà\b est suivi essentiellement de lieu et/ou quelques noms de personnes.
- le motif \ben\b est suivi aussi des noms de lieux, mais également de dates(en année,mois,etc..).
- le motif \bde\b est suivi normalement de quelques noms de personnes. Mais également des noms de lieux, d'équipes sportives et d'entreprises (pour le rubrique sport).
- le motif \bcontre\b fera le lien entre deux entités nommées de même type: personnes, Etats..
Il ne nous reste plus qu'à passer à la présentation des résultats :
le motif "à":
- Sport → introduit majoritairement un nom d'équipe ou le nom d'une ville (à Monaco, à Rennes).
- Cinéma → est utilisé pour introduire le nom d'une ville ou le nom d'une personne(à Harvey).
le motif "en":
- Médias → introduit une expression figée ("en bout de course").
- Sport → introduit aussi une expression figée ("en tête du classement") mais il est également suivi d'une date ("en 2017") .
- Cinéma → est utilisé pour introduire un nom commun.
le motif "de":
- Médias → introduit un complément d'un nom.
- Sport → introduit majoritairement un COI "est de retour".
- Cinéma → introduit un complément d'un nom.
le motif "contre":
- Sport → introduit majoritairement un nom d'équipe ou le nom d'une ville (à Monaco, à Rennes).
- Cinéma → introduit pour mettre en relation deux entités ("quelqu'un est contre X").