dots


Le Trameur

    Le Trameur est un logiciel créé par M. Serge Fleury, professeur de l'Université Sorbonne Nouvelle - Paris 3. Il s'agit d'un programme qui réalise des calculs lexicométriques sur un corpus donné. Parmi les options de traitement fournies par le Trameur, on peut réaliser des comptages de cooccurrences des termes autour d'un terme motif, analyser l'évolution de vocabulaire du corpus, ainsi que visualiser l'alignement de corpus parallèles.

    Notre projet fait une utilisation très simple du Trameur. Mais il faut remarquer que plusieurs autres traitements peuvent être faits en utilisant ce programme, y compris l'étiquetage de POS, à l'aide de treetagger.

La création des graphes de cooccurrences avec Le Trameur :

    Dans le cadre de notre projet, nous avons utilisé Le Trameur pour générer des graphes de cooccurrences autour du terme motif "mariage homosexuel". Il faut remarquer que comme le terme choisi pour notre projet est composé de deux mots (en anglais 3 mots, "same-sex marriage"), nous avons dû créer des dumps spéciaux pour traiter le motif composé en le remplaçant par "MARIAGE_HOMOSEXUEL". Après avoir fait cela, il est fondamental de changer les paramètres de délimiteur dans l'onglet "Param" du Trameur, car le caractère "_" est utilisé par les pôles remplacés et c'est l'un des délimiteurs par défaut du programme.

    On peut dire qu'il n'y pas qu'un seul paramétrage correct pour utiliser Le Trameur. Pourtant, l'utilisation des paramètres adéquats optimise l'obtention des résultats. Par exemple, il peut être intéressant de fournir une stop-liste avant d'extraire les cooccurrences d'un pôle donné, ainsi que le choix des valeurs cohérentes pour les champs seuil et Co-Freq. La stop-liste peut servir à empêcher que les mots grammaticaux et certains termes très fréquents dans la plupart des sites Web, comme "Accueil", "Contact", etc. apparaissent dans les graphes. L'exclusion de ces termes permet de générer des graphe "propres", contenant un vocabulaire plus spécifique et cohérent avec le corpus étudié.

    Une fois que nous avons créé les dumps spéciaux pour le Trameur et choisi les bons paramètres, on peut créer les graphes de cooccurrences. Pour cela, il faut aller d'abord dans l'onglet "Param" pour changer les délimiteurs par défauts et exclure le "_". Attention, ceci n'est pas une étape obligatoire ! Nous devons le faire car, comme nous avons dit auparavant, notre pôle composé a été remplacé par un pôle joker qui contient le caractère "_", et n'est composé que d'un seul mot.

    Après cela, nous devons indiquer au Trameur le corpus à traiter. Cette option est disponible dans l'onglet "Cadre". Puis il faut cliquer sur le bouton "Nouvelle Base" (image ci-dessous), dans le coin supérieur gauche de l'écran. Une fois que la base est chargée, on peut commencer à appliquer les traitements choisis.

trameur

    Pour créer les graphes de cooccurrences, il faut aller dans l'onglet "Cooc" et choisir les paramètres de votre préférence. Dans notre cas, nous avons voulu créer des graphes pour les pôles "MARIAGE_HOMOSEXUEL", "SAME-SEX_MARRIAGE" et "CASAMENTO_HOMOSSEXUAL". On peut noter que dans chaque image, nous avons choisi différentes valeurs pour les champs "Co-Freq"" et "Seuil". En outre, pour chaque langue, nous avons créé des stop-listes différentes, concernant les mots grammaticaux dans ces langues, et certains autres termes répétitifs cités ci-dessus.

Le traitement est lancé en appuyant sur le bouton ci-dessous :

trameur

Voici dans les images ci-dessous les graphes obtenus :

Anglais de Grande Bretagne

trameur

Anglais des États-Unis

trameur

Français de France

trameur

trameur

Français du Canada

trameur

Portugais du Brésil

trameur

Portugais du Portugal

trameur