Bilan

Scripts, résultats obtenus, corpus de test

Script

Arborescence incluant tous les scripts et outils d'annotation (TreeTagger et Talismane):

Corpus pour le test

Fichiers sortis

Rubrique traitée Remarque Fichier Téléchargement
À la une (3208) Texte brut de tous les titres et descriptions
À la une (3208) Texte annoté par TreeTagger
À la une (3208) Texte annoté par Talismane
International (3210) Texte brut de tous les titres et descriptions
International (3210) Texte annoté par TreeTagger
International (3210) Texte annoté par Talismane
Economie (3234) Texte brut de tous les titres et descriptions
Economie (3234) Texte annoté par TreeTagger
Economie (3234) Texte annoté par Talismane
Technologies (651865) Texte brut de tous les titres et descriptions
Technologies (651865) Texte annoté par TreeTagger
Technologies (651865) Texte annoté par Talismane

Fichiers sortis (Patrons morphosyntaxiques)

Rubrique traitée Patron Téléchargement
À la une (3208) ADJ + NOM
À la une (3208) NOM + ADJ
À la une (3208) NOM + PREP + NOM + PREP
À la une (3208) VERBE + DET + NOM
À la une (3208) VERBE + DET + NOM (sans numéro, pour le graphe)

boîte à outils 1

Parcours du répertoire arborescent, extraction du texte

Savoir plus

boîte à outils 3

Récupération des patrons morphosyntaxiques

Savoir plus