rah!

rah!

rah!

>>>Principe de la BaO#4

Mise en graphes des patrons extraits au cours de la BaO précédente.


>>>BaO#4, dernière ligne droite.

C'est la consécration, un semestre de codage de script pour obtenir les graphes que vous verrez ci dessous.

Futile? Tout ça pour ça? Peut-être bien.

Mais au-delà du résultat obtenu, gardez à l'esprit les étapes par lesquelles nous sommes passés, l'utilisation de savoirs, de programmes et de langages divers afin d'effectuer des traitements complexes sur des données qui n'étaient à l'origine pas conçues dans ce but. Car c'est bien l'adaptation de ces données qui s'est avérée être un véritable challenge.

>>>Patron2Graphe

Ce programme développé par SF que l'on retrouve intégré dans Le Trammeur, toujours développé par SF, permet de prendre en premier argument l'encodage du fichier à traiter, en deuxième argument un fichier .txt contenant sur chaque ligne une occurrence d'un patron extrait et en troisième argument un motif destiné à n'extraire que le mot qui nous intéresse.

La page de Patron2Graphe

Son utilisation s'avère rafraîchissante après avoir manipulé autant de scripts différents.

Il se lance sous Windows, à l'aide de l'invite de commande.

Rassurez-vous si vous n'êtes pas familiers avec l'invite de commande Windows, le peu d'actions que nous avons réaliser se font avec des commandes similaires à celles du terminal d'Ubuntu, à savoir:
  • cd
  • ... et rien d'autre!
Maintenant que vous êtes positionnés sur le dossier contenant patron2graphe.exe, vous n'avez plus qu'à le lancer en lui associant les deux arguments précédemment cités.

Si vous n'êtes pas sûrs de l'encodage des fichiers que vous voulez traiter, faites une vérification préliminaire (patron2graphe.exe prenant un fichier de motif différent en fonction de l'encodage).

Essayons avec des sorties issues du script codé par RB (.xml), encodées en UTF-8, sur la rubrique "Culture" des fils du Monde: Patron employé: NOM ADJ Patron employé: NOM PREP NOM
Ces représentations font penser à des arbres de grammaire TAG!

Essayons maintenant avec des sorties issues du script codé par JMD (Cordial), encodées en ISO-8859-1, toujours sur la rubrique "Culture" des fils du Monde:

Patron employé: NCFS ADJFS Patron employé: NCFS PREP NCFS
Récupérez les fichiers de patrons extraits en cliquant sur l'ancêtre de la clef USB.