Deuxième boite à outils

Avec cette deuxième boite à outils, nous allons étiqueter les fichiers précédemment obtenus avec les logiciels TreeTager et Cordial.

  • Les fichiers .txt seront étiquetés via cordial. Les fichiers soumis à ce logiciel doivent être encodés en ISO.
  • Les fichiers .xml seront enrichis par un étiquetage via TreeTagger à l'aide de la fonction etiquetage du programme précédent.

Fonction étiquetage par TreeTager

voici la fonction utilisée dans le programme en perl permettant d'étiqueter les fichiers via TreeTager :

Résultats

Voici les fichiers étiquetés pour la rubrique 3208 (actualité):

  • Cliquer ici pour voir le document .txt contenant les titres étiquetés par TreeTager.
  • Cliquer ici pour voir le document .txt contenant les descriptions étiquetés par TreeTager.
  • Cliquer ici pour voir le document .xml contenant les titres étiquetés par TreeTager.
  • Cliquer ici pour voir le document .xml contenant les descriptions étiquetés par TreeTager.
  • Cliquer ici pour voir le fichier titre étiqueté par cordial.
  • Cliquer ici pour voir le fichier description étiqueté par cordial.

Fichiers étiquetés pour la rubrique 3210 (international):

  • Cliquer ici pour voir le document .txt contenant les titres étiquetés par TreeTager.
  • Cliquer ici pour voir le document .txt contenant les descriptions étiquetés par TreeTager.
  • Cliquer ici pour voir le document .xml contenant les titres étiquetés par TreeTager.
  • Cliquer ici pour voir le document .xml contenant les descriptions étiquetés par TreeTager.
  • Cliquer ici pour voir le fichier titre étiqueté par cordial.
  • Cliquer ici pour voir le fichier description étiqueté par cordial.