Présentation
Dans le cadre de notre cours de M1 TAL nous avons mené à bien un projet d'étude de corpus.
Nous avons choisi comme sujet : l'homosexualité sur le Web.
A travers l'étude de corpora en trois langues : l'espagnol, le français et l'anglais, nous nous sommes fixés comme objectif de déterminer la perception de l'homosexualité dans ces pays et les différents concepts qui y sont associés.
Nous avons choisi un corpus de presse pour couvrir l'actualité et l'attitude générale dans les médias vis à vis de ce sujet et pour pouvoir cibler spécifiquement le pays source de production (respectivement l'Espagne, la France et le Royaume-Uni). Le corpus a été recueilli à partir d'adresses internet.
Pour analyser le corpus nous avons utilisé un script et une console bash.
Les résultats de notre analyse sont consultables dans l'onglet "résultat".
Yolène CONSTABLE
Poste
Etudiante en M1 Traitement Automatique des Langues à Paris Nanterre, je me suis chargée de l'Espagnol pour ce projet.
Valentin-Gabriel SOUMAH
Poste
Etudiant en M1 Traitement Automatique des Langues à la Sorbonne-Nouvelle, je me suis chargé de l'Anglais pour ce projet.
Malick SY
Poste
Etudiant en M1 Traitement Automatique des Langues à Paris Nanterre, je me suis chargé du Français pour ce projet.