«— Revenir à l'analyse

BàO 1 (et demi) | script Perl crée de zéro & autres

Script principal en Perl

Script tokenise

Programme treeTagger paramètres FR

Script de treeTagger à XML

Le script écrit tout au long du semestre et qui a été fait tourner pour toute une journée (parce que sur plusieurs rubriques) prend en argument le code de la rubrique recherchée, Pour expliquer le fontionnement du programme principal que l'on a utilisé on peut le diviser en 3 phase : Pour le traitement il y a plusieurs fichiers qui sont crées mais pour l'analyse finale on ne considérera que les deux premiers.

BàO 2 (demi) | étiquetage Cordial

L'étiquetage avec Cordial n'a pas présenté de gros problème, la seule problematique à laquelle on a dû faire fâce c'était l'encodage. Unicode n'étant pas reconnu par le programme, les texte ont étaient d'abord transcodé en ANSI pour après procéder à l'étiquetage à travers le bouton Syntaxe et les paramètres dans l'image suivante.

BàO 3 | script Perl JMD & requêtes XPath

Script d'extraction Cordial

Script d'extraction treeTagger

Cet autre script écrit durant le semestre prend en argument le fichier .cnr (le format texte étiqueté par Cordial) et un fichier contenant le motif à rechercher sous forme de patron morphosyntaxique, il nous renvoie les occurrences du motif recherché une fois codé en ISO-8859-1 et une fois transcodé en UTF-8.
Ce même script et les motifs ont été après modifiés pour pouvoir effectuer le même type d'extraction sur les rubrique en .txt étiqueté à travers treeTagger, pour permettre ce traitement on a réuni les fichiers titre et description obtenu par l'étiquetage.
En ayant à disposition aussi les données treeTagger sous forme XML une comparaison entre les trois résultats et l'utilisation d'une méthode d'extraction différente s'oblige, cette même méthode reviendra utile pour une comparaison dans la prochaine boîte à outils.

BàO 4 | patron2graphe.exe & feuille de style XSL

Archive patron2graphe

On opère ici sur l'affichage de motifs recherchés, pour cet affichage dans un premier moment on s'est servi du programme patron2graphe.exe. Pour pouvoir utiliser ce petit programme à la fois utile et sympa pour la visualisation des résultats on a du installer l'extension Wine pour macOS permettant d'appeler patron2graphe.exe directement sur le terminal comme s'il s'agissait d'une shell Windows.
De même, un affichage a été rendu possible à travers les applications XSL et XPath sur les documents XML disponibles, pour une vision plus étendue sur ce langage on vous renvoie à cet autre projet realisé toujours dans le cadre de ce semestre.