Bonjour! こんにちは! Hello ! 你好!

Nous avons analysé les quatre langues séparément.

Cliquez sur les liens ci-dessous pour voir l'analyse de chaque langue.

Pour voir la comparaison des quatre langues, cliquez sur Conclusion.

  • L'analyse du français
  • L'analyse d'anglais
  • L'analyse du japonais
  • L'analyse du chinois

  • Analyse du mot « 示威游行 (shì wēi yóu xíng) » dans notre corpus chinois

    (avec iTrameur et jieba)

    -Statistiques générales sur le corpus chinois

    Phrases 2528
    Caractères 149403
    Mots 95156
    Nombre moyen de mot par phrases (lisibilité) 37.64

    *Un mot chinois pourrais contenir un ou plusieurs caractères, par exemple, le mot « 示威游行 » contient quatre caractères.

    -Schéma de cooccurrences

    A l’aide d’iTrameur, nous avons obtenu trois schéma, le premier est sur le mot « 示威游行 (shì wēi yóu xíng) », le deuxième est pour le mot « 游行示威 (yóu xíng shì wēi) » et le troisième est sur le mot « 游行 (yóu xíng) », parce que la combinaison du mot « 示威 (shì wēi) » et mot « 游行 (yóu xíng) » ont le sens de « manifestation » ou « manifester », mais l’ordre de ces deux partis n’est pas fixé. D’ailleurs, on pourrais aussi dire « 游行 (yóu xíng) » brièvement.

    En observant les résultats, on voit que les mots que l’on a cherchés sont souvent associés aux les noms comme « 改革 (réformation) », « 养老金 (pension de retraite) » et « 国家主权(la souveraineté d'état) » qui nous enseignent la raison des manifestation. En plus, on observe que certain adjectifs tels que « 大规模 (grand) », « 非法 (illégal) » et « 浩浩荡荡 (nombreux) » qui décrivent la nature et l'ampleur de la manifestation.

    cooccurrences1cooccurrences2cooccurrences3

    -Segments répétés

    segments répétés

    On observe les segments répétés que autour du mot « manifestation », souvent, ils sont les descriptions des participants, du nombre des participants et de quelle façon de participation. Les participants sont souvent le peuple en Chine, et on n’indique pas leurs professions ou de quel groupe.

    -Nuage de mot

    nuage de mot

    Le nuage de mot du corpus chinois nous montre que les mots les plus fréquent sont « 游行 (manifester) » « 示威 (marcher) », « 香港(Hongkong) », « 政府(gouvernement) », « 集会(réunion) », « 警方(police) » et « 中国(Chine) ».



    Toutefois, ces résultats ne sont pas assez solides pour prouver ou infirmer notre hypothèse que ce mot « 示威游行 (shì wēi yóu xíng) » a une image négative en Chine. Par conséquence, l’étiquetage morphosyntaxique a été fait sur le corpus chinois avec un script de langage Python et le module jieba.

    -Analyse des adjectifs et les verbes

    adj et verbes adj et verbes

    Ensuite, en trouvant tous les adjectifs et les verbes autour du mot « 示威游行 (shì wēi yóu xíng) » , on observe que l’adjectif les plus utilisé est « 自由 (libre) » , « 大 (grand) », « 严格 ( sévère) », et « 新 (nouveaux) ». et les adjectifs négatifs sont «不满 (mécontent) », « 紧张 (intense) » et « 严重(grave) », ce qui n’est pas tellement négatif comme on le pensais. Quant aux verbes, ils sont «游行 (manifester) », « 进行 (avoir lieu) », « 申请 (demander la permission) », « 行动 (marcher) » et les verbes négatifs sont « 强制 (forcer) », « 威胁 (menacer) » et « 挑衅 (provoquer) ».

    En résumé, du corpus traité, la plupart des mots que nous voyons expriment objectivement des évènements, et les adjectifs et les verbes utilisés n'apparaissent pas autant d'informations et d'expression négatives que nous l'imaginions. Dans le même temps, il est choquant qu'il n'y ait pas trop de mots liés aux institutions ou groupes sociales.