L'analyse

L'analyse en anglais:

Dans le contexte anglais, la plupart des textes proviennent de la presse(90%). D'autreS,, 3% de textes sont trouvés dans les sites spécialisés dans le droit. Le mot le plus fréquent est Internet (si on ne prend pas en considération le retour à la ligne) Voici l’analyse générée par logiciel Trameur. On constate que pour le mot Internet et internet, on obtenu deux fréquences différentes. Parce que dans notre script, on a oublié de nettoyer le contexte obtenu. Par exemple, changer toutes les lettres majuscules en minuscules etc.

Example pic

L'analyse en français:

Après avoir choisi internet surveillance contrôle comme motif, on a réussi à récupérer tout le contexte qui contient ce mot clé. Ensuite, on va essayer de l’analyser avec avec l’outil Trameur. Voici le résultat obtenu :

Example pic

Dans ce résultat, il y a quelques chiffres qui nous intéressent beaucoup: 248 occurrences de formes dont 80 formes hapax (les mots qui n’apparaissent qu’une seule fois). La forme maximale est « surveillance » qui se présente 27 fois dans le contexte. Ici on a constaté un phénomène qui nous paraît mystérieux : si on ouvre la base en UTF8, on obtiendra 248 occurrences de formes ; alors si on l’ouvre en LATIN 1, on aura 253 occurrences de formes. Où cette différence provient-elle ? C’est un mystère qui reste à découvrir. Au niveau de la forme maximale, on a fait une analyse de l’accroissement du vocabulaire : La fréquence de la forme « surveillance » s’accroît en fonction du nombre d’occurrence (dit position dans le corpus).

Example pic

L'analyse en persan:

Le contexte en persan nous apprend bien des choses sur le champs linguistique utilisé pour le mot اینترنت کنترل (internet contrôle). En effet ce terme est surtout utilisé dans un contexte journalistique. Dans ces sites on parles beaucoup de pays qui ont recours à la censure et notamment beaucoup de la Chine et de l'Iran. Le contexte politique y est également abordé vu que ces censures sont plutôt liées à des causes politique dans ces pays alors que la censure dans les autres pays comme la France ou les États-Unis peuvent avoir des causes très diverses.

L'analyse en chinois:

Le contexte en chinois n’est pas analysable dans le trameur pour des causes mystérieuses même si on a essayé avec tous les encodages pour la base dans le trameur. En chinois, le mot 网络监管 est une combinaison de la surveillance et le contrôle d’Internet. Donc il a une signification un peu plus large par rapport aux motifs en anglais et en français. Le contexte qu’on a obtenu grâce à notre programme parle principalement de deux aspects : la censure d’Internet et la surveillance de la sécurité du business en ligne. Bien évidemment, le deuxième aspects ne nous intéresse pas beaucoup. Cette ambiguïté provient de la multisignification du mot chinois. C’est-à-dire en chinois un seul mot porte plusieurs significations.