Boîte à Outils 3

À partir de BÀO 2, nous avons le fichier XML annoté et le fichier CNR. Le but de cette partie est d'extraire les patrons morpho-syntaxique à partir de ces deux fichiers.

On a 4 moyens de faire ça. La première consiste à utiliser un script perl, qui prend comme argument le fichier CNR et un fichier qui contient les patrons à chercher, et qui met le résultat dans un fichier text. Voici les script et un exemple des résultat.

Solution 1:


Voici le source CNR et le résultat:


Solution 2 est de la même démarche que solution 1, sauf qu'il inclut le pattern de patron dans le script, et qu'il produit la fréquence après les patrons. ICi-dessous c'est le script et le résultat quand on recherche la patterne Nom-PRP-NOMdans le fichier 3208-iso.cnr:

Solution 2:


Le résultat:



La 3ème solution c'est extraire les information à partir des fichiers XML avec un script perl. Voici le script:

Solution 3:

On le lance dans la ligne de commande:

Dans le fichier de pattern on cherche NOM-PRP-NOM dansle fichier 3208.xml, voici le résultat:



La 4ème solution c'est d'établir une feuille de style de xslt pour extraire tous les patrons qui correspondent au pattern défini dans le fichier XSLT. Ici on extrait le pattern NOM-ADJ et ADJ-NOM. Pour voir le résultat, cliquez directement sur le icône de XML ci-dessous:

On a finit BAO 3 avec 4 différents moyens, ensuite il faut utiliser ces patrons pour le BAO 4. On choisit le résultat de 3ème solution.Vous pouvez télécharger le contenu de cette partie en cliquant sur l'icône ci-dessous: