De quoi traite le projet?

Il s'agit de la mise en oeuvre d'une chaîne de traitement textuel semi-automatique, depuis la récupération des données jusqu'à leur présentation.

Example pic

La récupération des données se fera grâce à un mot clé recherché dans des urls choisies, quand à la représentation, elle se fera sous forme de nuages de mots.

Le mot clé

Le choix du mot clé s'est fait en fonction des langues (persan, chinois, français et anglais)que nous avons décidé d'étudier. En effet deux de ces langues, c'est à dire le chinois et le persan, avaient un sujet commun: le pays dans lequel ils étaient pratiqués était sujetes à des censures, contrôle et suveillance de très grande importance au niveau internet. Les mots clés que nous avons choisis sont: internet censure en français, internet surveillance en anglais, 网络监管 en chinois et کنترل اینترنت en persan.