Projet Master TAL

L'iTrameur:

L'iTrameur est une version "en ligne" du Trameur

Il a des fonctionnalités similaires mais en nombre restreint par rapport au Trameur, un programme de génération, de gestion de la Trame et du Cadre d'un texte (i.e découpage en unité et partitionnement du texte : le métier textométrique) pour construire des opérations lexicométriques / textométriques (ventilation des unités, carte des sections, cooccurrence, spécificité, AFC...)

Il permet aussi de générer et de gérer des annotations multiples sur les unités du texte (et de traiter les niveaux d'annotations visés)

Ce logiciel a pour objectif de compter les éléments (mots ou groupes de mots) d’un texte qu’il annote pour construire un système de coordonnées sur la séquence textuelle sous forme arborée. On l'a utilisé pour chercher les occurrences et les coocurrences de nos mots clefs.

Analyse:

Sans surprise,on retrouve "le" et "du" dans les mots les plus fréquents. Aucune surprise non plus du côté des réseaux lexicaux, on a pu constater que les mots liés à la nutrition dominaient le corpus.

En français, les mots les plus récurrents sont: blanc, complet, seigle,industruel,campagne mais aussi manger, grossir, glycémie, aliment, bon. Nous ne devons pas sous-estimer l'importance de certains mots grammaticaux : on a tendance à se dire qu'ils vont être inutiles pour une analyse (aussi brève soit-elle) linguistique. Pas forcément, bien au contraire, leur présence ou absence peut s'avérer primordiale en l'occurrence lorsque nous voulons interpréter les résultats fournis par l'iTrameur. Ici, nous avons: dans, sur, tout, que. Sans oublier le "pourquoi", parce qu'on pose fréquemment des questions sur la consommation du pain.

En arabe, On retrouve beaucoup plus les adjectifs de nationnalité ou origine: العربي(arabe), الفرنسي(français), السوري(syriéen), الجزائري (algérien) pour montrer les sortes de pain. Mais aussi, on remarque que les mots qui dominent le corpus sont les méthodes de fabrication du pain et les ingrédients utilisés pour: القمح (blé),طريقة (méthode), الخمير(levure), الذرة(farine de maïs), الشعير(avoine)...

Comparaison:

Il semblerait que les sites français soient plus axés sur des conseils alimentaires contrairement aux sites arabes.

Les français semblent porter beaucoup d'attention sur les effets qu'a le pain sur le corps , en matière de santé. Alors que dans le monde arabe, on s'intéresse plus particulièrement aux contenus dans le pain en mettant en avant une multitude de recettes.