Bao 4 - Des textes aux Graphes

Dans la Bao4, on applique le programme pour MACOSX patron2graphedemots-unix de M.Serge FLEURY sur les données construites à l'issue de la BàO3, qui sont les fichier textes des patrons qu’on a extrait, pour générer des graphes autour d'un motif. Un petit conseil pour ce qui utilise le Macintoch, si vous ne pouvez pas l'exécuter sur le Macintoche, vérifiez si vous avez installé le X11. On a essayé de choisir des termes différents pour voir avec quels mots sont t’ils associer. A chaque fois, on lance le programme depuis les lignes de commande avec cette commande :

./patron2graphedemots-unix "utf-8" 3208Patron_ADJ_NOM.txt motif.txt

Les fichiers pour travail sont :
Pour rubrique A la une (N°3208) : 3208Patron_ADJ_NOM.txt ; 3208Patron_N_P_N_P.txt ; 3208Patron_NOM_ADJ.txt ; 3208Patron_V_DET_NOM.txt
Pour rubrique Culture (N°3246) : 3246Patron_ADJ_NOM.txt ; 3246Patron_N_P_N_P.txt ; 3246Patron_NOM_ADJ.txt ; 3246Patron_V_DET_NOM.txt

*Si

Représentation graphique GRAPHIQUE

1. Sur patron NOM ADJ - Motif : chinois / français

MOTIF=\b[Cc]hinois

L'intérêt de l'analyse de ce terme repose sur les idées sur les chinois/la Chine lorsqu'ils parlent sur rubrique A la une et rubrique Culture et également la différence quant aux français.

bao4_chinois_3208_Nom_ADJ

(↑ la résultat de la rubrique 3208 du patron NOM ADJ sur le motif "chinois")


bao4_chinois_3246_Nom_ADJ

(↑ la résultat de la rubrique 3246 du patron NOM ADJ sur le motif "chinois")


En observant l’entourage du mot « chinois » on remarque que le mot dans la rubrique « A la une » est associé avec : gouvernement, entreprise, touristes, investisseur, produits, concurrence, commerçants,etc. Les médias sont intéressés par plutôt l’économie et la politique chinoises tels que l'industrie du tourisme et l’ndustrie manufacturière. En revanche, dans la rubrique « Culture », il est associé aux mots qui ont une relation avec la culture général : écrivain, réalisateur, collectionneurs, etc.

Par ailleurs, on a gérnéré également les graphes autour le motif « français » pour voir les différences.

MOTIF=\b[Ff]rançais.*\b

bao4_francais_3246_Nom_ADJ

(↑ la résultat de la rubrique 3246 du patron NOM ADJ sur le motif "français")

On observe que pour la rubrique « Culture » le terme est associé à une grande diversité de termes dont la plupart n'apparaissant qu'une seule fois tels que : architect, musicien, plasticien, lois, académie, réligion, etc.

2. Sur patron NOM PREP NOM PREP - Motif : homme

Le deuxième mot qu’on a choisi est « homme » et notre hypothèse est qu’il aurait des différences d’expressions sur ce mot selon les rubriques.

MOTIF=\b[Hh]omme.*\b

nao4_homme_3208_NpNp

(↑ la résultat de la rubrique 3208 du patron NOM PREP NOM PREP sur le motif "homme")


bao4_homme_3246_NpNp

(↑ la résultat de la rubrique 3246 du patron NOM PREP NOM PREP sur le motif "homme")

En fait, on ne voit pas trop des variétés, et le mot  « affaires » affiche dans les deux rubriques et on pense que c'était à cause du petit nombre des données.