EXTRACTION DE PATRONS MORPHOSYNTAXIQUES





  Démarche à suivre

L'extraction des patrons (BAO 3) sera faite sur:

1- le fichier .cnr étiqueté par Cordial avec le script Perl qu'on a construit avec M. Jean Michel Daube.
2- le fichier XML étiqueté par TreeTagger avec des requêtes XPATH.

Nous avons choisi de travailler sur l'extraction de la terminologie. Pour cela on a choisi d'extraire NOM ADJECTIF.
Nous allons essayer d'extraire des termes dans la rubrique Social et la rubrique International.

  Patrons morphosyntaxiques via l'étiquetage réalisé par Cordial

Nous avons utilisé le script construit durant le cours par M. Jean Michel Daube que voici;



Voici le résultat obtenu: international_NC_ADJ.txt    social_NC_ADJ.txt


  Patrons morphosyntaxiques via l'étiquetage réalisé par TreeTagger

Nous avons réalisé l'extraction des patrons a partir du fichier XML par une requête XPATH.

Voici le résultat obtenu: international.xml    social.xml