Analyse textométrique avec Itrameur

Afin de réaliser l'analyse de nos données textuelles, nous avons utilisés iTrameur qui est est une application en ligne mettant en oeuvre des fonctionnalités disponibles dans Le Trameur, notamment la réalisation d'un graphe de cooccurrents sur un pôle donné. Cette analyse nous permet de faire ressortir les termes les plus utilisés au côté de nos motifs.

Cooccurrents

Chinois

家庭 jiā tíng

Analyse des fichiers contexte

Selon ce graphe, nous pouvons observer que, dans la littérature chinoise, le mot qui se combine le plus fréquemment avec 家庭 est 条件 (tiáojiàn, condition) et la particule 的 (de). La particule 的 ne fait rien ressortir mais 条件, au côté de 家庭, nous fait comprendre que dans les fichiers contexte, il est question de condition familiale.

Analyse des fichiers dump

Dans les fichiers dump, aucun mot ne semble ressortir plus que les autres. Les cooccurrents ont tous un indice de spécificité inférieur à 10. On retrouve 条件 et 的 mais aussi de nouveaux mots tels que :

  • 生活 (vie)
  • 基础 (base)
  • 琐事 (bagatelle)
  • 自绝 (se couper (de))
  • 平民 (civils, gens du peuple)
  • 实即 (vraiment)
  • 中产 (classe moyenne)
  • 地主 (propriétaire foncier)
  • 住址 (adresse)
  • 荣誉 (réputation, honneur)
  • 社员 (membre)

家族 jiā zú

Analyse des fichiers contexte

Pour le mot 家族, trois mots ressortent plus que les autres :

  • 金正日 (Kim Jong Il, ancien leader de la République populaire démocratique de Corée)
  • 生活照 (photo de la vie quotidienne)
  • 揭开 (ouvrir, dévoiler)

Une ou plusieurs de nos urls semblent concerner Kim Jong Il et sa vie de famille. Les occurrences de 家族 ont dû dominer dans ce texte sur Kim Jong Il ce qui fait que nous ne retrouvons que les occurrents d’un seul texte.

Analyse des fichiers dump

Dans l’analyse des fichiers dump, nous retrouvons les trois cooccurrents présents dans les fichiers contexte mais le mot le plus présent autour de 家族 est 食草 qui signifie "herbivore".

  • 长辈 (aînés)
  • 黄金, accompagné de 家族 fait référence aux descendants directs de la dynastie mongole des Yuan (1271 ~ 1368)
  • 草 (herbe)
  • 侵扰 (envahir et causer des troubles)
  • 成员 (membre)
  • 红高粱 (Sorgho rouge qui est une céréale mais aussi un film et roman chinois)
  • 梦 (rêve)
  • 吃 (manger)
  • 攻伐 (attaquer)

Japonais

家庭 Katei

Analyse des fichiers contexte

Pour le mot 家庭, deux mots apparaissent en coocurences :

  • 生活 (seikatsu) : la vie quotidienne
  • 幸福 (kôfuku) : le bien-être, heureux

Analyse des fichiers dump

Dans l’analyse des fichiers dump, nous trouvons les mots suivants en plus des deux trouvés en contexte :

  • 料理 (ryôri) : cuisine
  • 教育 (kyôiku) : éducation
  • 円満 (enman) : heureux
  • 中流 (chûryû) : classe moyenne
  • 主婦 (shufu) : ménagère
  • ふつう (futsû) : normal
  • 平和 (heiwa) : paix
  • 女 (onna) : femme

家族 Kazoku

Analyse des fichiers contexte

Pour le mot 家族, quatres mots ressortent plus que les autres :

  • 者 (sha/mono) : membre
  • 生活 (seikatsu) : vie quotidienne
  • 関係 (kankei) : relation
  • 制度 (seido) : système

Analyse des fichiers dump

Dans l’analyse des fichiers dump, on retrouve les quatres mots précédents. Comme il y a beaucoup de coocurents, nous allons vous présentez les premiers.

  • たち (tachi) : pluriel
  • 人 (nin) : membre
  • 全員 (zen.in) : tous

Portugais

Família

Analyse des fichiers contexte

família (au singulier, minuscule) : avec une fréquence très élevée, « família » c’est la forme la plus importante du mot parce que c’est elle qui a le plus d’occurrences dans tous les fichiers. Malheureusement, en essayant d’analyser des coocurrents des fichiers contexte, itrameur n’a rien affiché. De plus, en analysant les résultats sur itrameur, la forme du mot au pluriel « famílias » présente aussi une fréquence significative, comme il est possible de voir dans l’image ci-dessous. Une autre occurrence curieuse est « Família » commençant par majuscule. L’époque et le genre des textes ont beaucoup influencé dans ce dernier cas.

Malheureusement, après plusieurs tentatives sur différents systèmes d’exploitation, pour le mot « família », il y aucune affichage, ni de graphes, ni de tables avec des fichiers contexte.

Família (au singulier, en commençant par F majuscule) : le coocurrent qui attire l’attention est « Real » (royale, en français). Les deux initiales majuscules, parce que c’est comme ça qu’on fait référence à la famille royale en portugais brésilien.

  • Real (royal.e)
  • olhos (yeux)
  • surge (surgit)
  • ante (devant)
  • respeitava (respectait)
  • sequer (même pas)

famílias (au pluriel, minuscule) : dans ce cas dans les fichiers contexte, en plus des mots vides, il y a aussi des mots qui renvoient à des textes littéraires de l’époque, comme abençoavam (bénissent), enfermos (malades).

  • as (las)
  • das (de las)
  • duas (deux)
  • abençoavam (bénissent)
  • receberá (recevra)
  • enfermos (malades)
  • quatro (quatre)
  • As (Las)
  • algumas (certaines)
  • muitas (nombreuses)
  • cinco (cinq)
  • saíam (certaines)
  • outras (autres)

Analyse des fichiers dump

família (au singulier, minuscule) : família imperial est une autre façon de se référer à la famille royale, compte tenu du contexte politique de l’époque, la fréquence du coocurrent « imperial » est aussi compréhensible. C'est une autre façon de se référer à la famille royale, après que Don Pedro I a déclaré l’indépendance du Brésil, cessant d’être colonie du Portugal en 1822, on a commencé à utiliser « famille impériale » au lieu de « famille royale », parce qu’il s’agissait de la famille de l’Empire du Brésil, pas plus la famille royale portugaise au Brésil colonial. Reunida (réunie) est un autre cooccurent (adjectif) qui aide à comprendre la famille dans la culture brésilienne. Des familles réunies, à des dates spéciales ou pendant les déjeuners de week-end, est quelque chose de très commun au Brésil et, par conséquent, est représenté dans la littérature brésilienne.

  • da (de la)
  • sua (sa)
  • cruz (croix)
  • à (à la)
  • imperial (impérial)
  • a (la)
  • chefe (chef, maître)
  • real (royal.e)
  • minha (ma, mienne)
  • seio (sein)
  • reunida (réuni)
  • compunha (composait)
  • composta (composée)
  • Coqueiro (Coqueiro est un nom de famille)

Família (au singulier, en commençant par F majuscule) : le seul coocurent de « Família » qui s'affiche avec des fichiers dump est le mot « Real » (royal.e). Le contexte historique expliqué au-dessus est plus évident ici

  • Real (royal.e)

famílias (au pluriel, minuscule) : dans ce cas, les occurrences des fichiers dump sont très similaires à celles déjà présentées à propos des fichiers contexte.

  • as (las)
  • das (de las)
  • duas (deux)
  • abençoavam (bénissent)
  • reconstituíram (ont reconstitué)
  • reposto (rétabli)
  • aldear (construire des villages)
  • embrulhavam (enveloppaient)
  • entregariam (livreraient)
  • abastadas (aisées, riches)
  • receberá (recevra)
  • luminárias (luminaires)
  • reclusos (détenus)
  • algumas (certaines)
  • visitara (avait rendu visite)