Boîte à outils 3

La BAO3 consiste en l'extraction de patrons syntaxiques sur les fichiers obtenus en BAO2! ( des exemples à télécharger : exemple Treetagger, exemple Cordial )

Treetagger x PERL x XML::Xpath

Nous pouvons utiliser le module XML::XPath sur les sorties Treetagger qui sont en XML, avec le chemin nous trouvons les noeuds qui nous interressent et récupérons le contenu! Ce script est celui de RB! Nous lui indiquons les patrons recherchés au moyen d'un fichier .txt dans ses arguments en ligne de commande.

Ici, le script complet!

Le fichier patron.txt :

bao3

Les sorties pour chaque rubrique :

bao3

Exemple :

bao3

Cordial x PERL

Pour Cordial, nous avons extrait les patrons au moyen d'un script PERL auquel on indique encore une fois dans un fichier.txt en argument le patron recherché, puis l'extration est mise ensuite dans des tables de hashages avec les tokens, lemmes et part of spreech, la sortie ne rend que les tokens correspondant aux patron. C'est le script fait avec JMD!

Ici, le script complet!

Le fichier patron.txt, que l'on doit ici changer pour chaque nouveau patron :

bao3

Les sorties pour chaque rubrique :

bao3

Exemple :

bao3

Pour l'utilisation des patrons :

Allons à la BAO4 !