A la sortie de BAO2, pour chaque rubrique, nous avons obtenu des textes étiquetés par Cordial en format .cnr et par Treetagger reformatés en .xml. Pour la BAO3, nous allons prendre ces fichiers comme entrée, et extraire des patrons selon des patterns morpho-syntaxiques souhaité, dans notre cas, les patrons morphosyntqxiaues à extraire sont: NOM ADJ. Pour réaliser cette étape d'extraction des patrons, il s'agit de différentes solutions possibles :
Cliquer pour afficher le script perl
Voici le résultat d'extraction des patrons morphosyntaxiques :
Solution alternative proposé par Monsieur Serge Fleury :
L'archive
contient 2 scripts permettant d'extraire des patrons morphosyntaxiques sur des données étiquetées par Cordial. Le script V1 prend 2 arguments : le fichier cordial et un fichier de patrons. Le script V2 prend un certain nombre d'arguments : le fichier cordial et la suite des cha?nes correspondant au patron visé (par exemple : "NOM" "ADJ")
Cliquer pour afficher le script pour afficher le script perl