Extraction de patrons avec des requêtes XPath

 

Cette fois-ci nous disposons également d'un script Perl qui a été construit pendant le cours avec l'aide de M. Belmouhoub.

 

À la différence du premier script, celui-ci effectue l'extraction des patrons à l'aide de requêtes XPath. Les fichiers traités ont été en format XML. Leur contenu a été étiquetté avec TreeTagger, chaque balise  correspondant à une  étiquette spécifique :

 

photo

 

Ce script prend aussi en argument une liste de patrons de notre choix :

 

photo

 


En voici un exemple :

 

photo