BAO4



Graphes



Pour avoir une visualisation graphique des patrons, nous allons construire des graphes, et comme nous travaillons toutes les deux dans un univers macintosh , nous avons téléchargé le fichier patron-unix, fourni par les professeurs, publié sur l’ENT.

Les fichiers d’entrée sont les outputs des patrons générés par TALISMANE. Par ailleurs, il fallait dans un premier temps mettre chaque patron dans un fichier séparé, donc on avait 4 fichiers différents pour chaque rubrique choisie.


"A la une"





"International"




Après, nous avons créé un fichier txt dans lequel nous avons mentionné le motif cherché. Par exemple, "catalan".



EXECUTION DU PROGRAMME



Suite à ces différentes étapes, nous avons exécuté le programme sur la ligne de commande.

L’exécution du programme demande trois arguments: un premier qui est l’encodage des fichiers d’entrée, un deuxième qui le fichier de l’un des patrons (que nous avons préalablement séparés) et un troisième qui contient le motif:

«  ./patron2graphedemots-unix "iso-8859-1" patrons-test.txt motif.txt »


Pour la rubrique "International" nous avons choisi le motif ‘catalan’, nous avons remarqué que le mot est le plus souvent utilisé avec les mots comme :
indépendance, séparatiste, crise, président, leader, dirigeants.


Même si l'emploi de ces mots semble petit (1 fois / patron), nous pouvons reconstruire le contenu des actualités.

Notamment, cela parle des événéments après 2017 en Espagne. Selon cairn.info, "le 1er octobre 2017, un référendum d’indépendance – déclaré illégal par le Tribunal constitutionnel espagnol – s’est tenu en Catalogne. 90 % des votants ont choisi l’indépendance. Après la proclamation de la « République de Catalogne », le chef du gouvernement espagnol a dissous le Parlement régional et convoqué des élections anticipées. Si les indépendantistes ont remporté ce scrutin, aucun camp ne sort vainqueur de la crise catalane."




En regardant les patrons extraites, nous pouvons ainsi imaginer cette situation politique montrée par "Le Monde" et voir si la connatation des mots utilisés est neutre. Par exemple, le mot "séparatiste" qui figure dans la liste nous semble assez négatif (VS. "indépendantiste", par exemple). Son emploi dans les médias nous intéresse comme un thème pour une analyse linguistique dans l'avenir. D'autres mots, sont par contre neutres et moins pertinents en terme de l'extraction de l'opinion médiatique sur ce sujet.



D'autre côté, nous avons aussi essayé avec le mot ‘scandale’ pour voir des événéments choquants de 2018 selon "Le Monde" et avons obtenu le résultat suivant :
financier (1), bancaire (1), politique (1), international (1), retentissants (1), sexuel(s) (2), immobilier (5)



Ce qui peut nous indiquer que cette année était marquée plus par des scandales sexuels (probablement, l'affaire de Harvey Weinstein, producteur américain, accusé de rélations sexuelles non consenties), et des scandales liés à l'immobilier.





A la fin, nous avons regardé l'emploi du mot 'français' dans la presse mentionnée ci-dessus. Malgré beaucoup de paires de mots trouvés, nous n'avons pas pu obtenir de résultats dites pertinents, le contexte étant très neutre.


La plupart de mots est liée aux secteurs de l'agriculture et de la politique :
goûts, vins, pêcheurs, industriel, socialistes, président, ambassadeur, affaires, justice, législation, colonisation, République etc.

Pour voir plus de graphes, vous pouvez consulter notre archive :