Extractions des patrons morphosyntaxiques:

  • Les fichiers Cordial
  • Nous commençons tous d'abord avec les fichiers de Cordial. avec le programme de M.Daube écrit en Perl. Ce programme prend en entrée le fichier cordial (.cnr) et le fichier paramètre pour les patrons morphosyntaxique à extraire.

    Pour les trois fichiers Cordial nous extrayons les patrons:

  • fichier Cordial des patrons pour la rubrique International 3210
  • fichier Cordial des patrons pour la rubrique Politique 0
  • fichier Cordial des patrons pour la rubrique Economie 3234

  • Les fichiers Treetager
  • A l'aide du script perl de M.Fleury qui prends en entrée le fichier xml de chaque rubrique et donne un fichier (.txt) des patrons syntaxique de type Nom-Adj:

  • fichier Treetagger des patrons pour la rubrique International 3210
  • fichier Treetagger des patrons pour la rubrique Politique 0
  • fichier Treetagger des patrons pour la rubrique Economie