Sample image

Résultats

Les trois rubriques que j'ai analysé :
1. 3236 - Médias
2. 3242 - Sport
3. 3476 - Cinéma

Les motif que j'ai décidé d'extraire sont :
- DETD.. NC.. VINDP3. PREP N....?
- DETD... NC.. VINDP3. PREP N....?
- DETD.. NC... VINDP3. PREP N....?
- DETD.. NC. VINDP3. PREP N....?
- DETD... NC... VINDP3. PREP N....?
- DETD.. NC.. VINDP3. PREP NPI
- DETD.. NC.. VINDP3. PREP NCI

Nous allons comparer :
- les résultats entre les différentes rubriques.
- les résultats de patrons extraits sur une même rubrique selon l'outil utilisé.
- donner un avis critique sur Tree Tagger & Cordial.

3236


Tree Tagger:
Résultats script perl (ici)
Résultat feuille de style XSL (ici)

Cordial :
Résultats script perl 1 (ici)
Résultats script perl 2 (ici)

3242


Tree Tagger:
Résultats script perl (ici)
Résultat feuille de style XSL (ici)

Cordial :
Résultats script perl 1 (ici)
Résultats script perl 2 (ici)

3476


Tree Tagger:
Résultats script perl (ici)
Résultat feuille de style XSL (ici)

Cordial :
Résultats script perl 1 (ici)
Résultats script perl 2 (ici)

Analyses

On constate que TreeTagger et Cordial ne font pas les mêmes étiquetages. Par exemple, chez TreeTagger il n'y a pas de "défini" ou "indéfini" , ni "pluriel" ou "singulier" au niveau des déterminants, puisqu'ils sont tous considérés comme étant juste un "DET:ART". Cependant, il y a bien une distinction entre pronom det et article. En effet, alors que TreeTagger va considérer "du" ou "ces" comme étant des "PRO:det", Cordial va les considérer comme étant des déterminants. L'autre opposition que j'ai constaté fut , c'est la définition de "préposition". En effet, on voit que "des" est considéré comme une préposition chez TreeTagger car il est composé de "de + les". Ainsi, on peut donc conclure que sur Cordial, nous avons davantage de marque de mode, de genre et de nombre contrairement à TreeTagger c'est pour cela que nous n'obtenons pas les mêmes résultats dans les deux outils.