SOY Ugur

Projet sur les mot du web

Analyse sur le iTrameur

Analyse Itrameur
C'est parti pour l'analyse !!!!

« Le Trameur est un programme d'analyse comportant de nombreuses fonctionnalités pour l'analyse automatique, statistique et documentaire de textes en vue de leur profilage sémantique, thématique et de leur interprétation. ».

Le « iTrameur » s'agit d'un programme similaire à « LeTrameur » la version software.


Tout d'abord, j'ai changé le délimiteur « § » par un espace vide car la partition ne nous convenait pas. Et nous avons obtenu un répertoire des cooccurrences par ligne.











L'onglet Cadre / Cadre (ce sont les couples de positions structurant le texte initial en parties). Le cadre textométrique permet de visualiser les différents fichiers constituants le corpus concaténé.




Après avoir importer mon corpus contenant les contextes concaténer, sur iTrameur.

Je commence l'analyse. Tout d'abord, je tape le terme recherché dans le "pôle source".

Il est intéressant de constater que le de "classe moyenne" est, comme en français, un mot composé.








Le résultat affiché est d'un côté, logique, et de l'autre, inattendue. Le logiciel m'affiche soit le mot "orta" (moyenne) soit le mot "sinif" (classe) mais pas l'un et l'autre ensemble.







Lorsque j'essaie de chercher le terme "orta sinif" ensemble. Je ne trouve rien.







Ci-dessous, nous voyons que si nous recherchons "orta" ou "sinif", nous obtenons des résultats.











Pour y remédier, je décide de transformer mon mot composé "orta sinif" en "OS" avec Notepad++ que j'applique sur mon corpus.







De retour sur mon corpus, je cherche dans l'onglet "Cadre", les occurrences de "OS" (orta sinif). Effectivement, ce mot est en tête de liste avec 76 occurrences dans le corpus.







Le turque étant un langue agglutinante, nous pouvons voir des mots comme "OSlar", "OSin", "OSa" et "OSi". Le OS représente le mot "orta sinif" et "lar", "in", "a" et "i" sont des suffixes.

Pour pallier ce problème, il suffit de le nettoyer le corpus avec Notepad++. La supression des suffixes n'entrave pas notre analyse.

























Le résultat de la fréquence de "OS" est monté à





L'onglet Cadre / (et le sous-onglet) Spécifs totales permet de visualiser la fréquence de tous les mots présents dans le corpus. Nous voyons ici que les mots qui viennent en tête sont des mots outils (grammaticaux) comme ; ve (et), bir (un), da(locatif), bu(démonstratif), için (pour) ....

Ce qui en est de même pour le français.







Avec l'expression "OS" signifiant "orta sinif", je cherche dans l'onglet Coocs/ (et le sous-onglet) cooccurrent sur les parties sélectionnées et je limite le nombre de terme à droite et à gauche à 5.

Je constate que les termes qui apparaissent ; "ailelerin" signifiant appartenant aux familles, "calisanlar" signifiant les travailleurs, "ülkelerde" signifiant dans les pays, öncelikle signifiant d'abord dans le sens de priorité, "dar" signifiant étroit, serré, et enfin "tüketiciyi" signifiant les consommateurs.

Nous avons une dimension internationale d'une classe moyenne en détresse, en perte de pouvoir d'achat.







Le résultat est d'autant plus intéressant lorsque nous faisons la recherche en augmentant le nombre de terme à 10 à droite et à gauche.

En effet, cette fois les termes apparaissant sont aussi associé à la détresse des classes moyennes, à leurs appauvrissement.

Mais il y a ici une dimension assez intéressante, les termes entourant le mot pose un questionnement sur ce qu'est la classe sociale avec l'adverbe "Nedir" signifiant "pourquoi" et l'insistance sur les classes moyennes supérieur avec l'adjectif "üst".







Cela nous donne le graphe de coocurrent suivant ;



Nous constatons qu'il y a des mots grammaticaux comme "ve" signifiant "et" en français et donc non pertinent pour notre.

De ce fait, je décide de l'ajouter à la stopliste pour ensuite avoir un nouveau graphe de coocurrent sans les mots seléctionnés (mots grammaticaux).







Je décide de relancer l'analyse des cooccurrents pour avoir une analyse plus pertinente.



Nous voyons que les mots grammaticaux ne sont plus présent dans mon graphe. Les mots clés évoqués nous donne une perspective d'analyse assez intéressante.

La classe moyenne est associé aux "travailleurs", à un concept nouveaux et grandissant, à la consommation ainsi qu'au bien être.

Avec les mots clés, je peux ressortir l'analyse suivante ; La classe moyenne a émergé au cours de la dernière décennie, cette classe sociale a émergé au sein de la classe ouvrière et a atteint un niveau de bien être.





Ce graphe a été réalisé avec l'onglet "Ventilation".

Voulant comparer les différentes parties du fichier concaténé, Nous pouvons aperçevoir des pics, ce sont les parties où l'expression "orta sinif" apparaît le plus.









Voici le réseaux le coocurrent du mot "classe moyenne" en turque;



Les mots frappants sont ; classe moyenne supérieur, consommation, revendication, salaire supérieur à la moyenne, oublie (ils se sentent oubliés).
News

Nuage de mot
Si vous voulez jetez un coup d'oeil sur mon nuage de mot, il va falloir faire un détour par mon blog, voici le lien :
More...