Extraction de patrons avec des requêtes XPath
Cette fois-ci nous disposons également d'un script Perl qui a été construit pendant le cours avec l'aide de M. Belmouhoub.
À la différence du premier script, celui-ci effectue l'extraction des patrons à l'aide de requêtes XPath. Les fichiers traités ont été en format XML. Leur contenu a été étiquetté avec TreeTagger, chaque balise correspondant à une étiquette spécifique :
Ce script prend aussi en argument une liste de patrons de notre choix :
En voici un exemple :