dots


La vie multilingue du terme "mariage homosexuel" sur le web

icon

    Ce travail a été mené dans le cadre du cours de Projet Encadré du Master en Traitement Automatique des Langues proposé par les universités Paris-Ouest Nanterre, Paris 3 Sorbonne Nouvelle et l'Institut National des Langues et Civilisations Orientales (INALCO). Il s'agit d'une mise en œuvre des acquis de notre premier semestre de formation.

    La réalisation du projet a été orientée par les professeurs Serge Fleury (Paris 3) et Jean-Michel Daube (INALCO).

    L'objectif principal du projet La Vie Multilingue de Mots sur le Web est d'obtenir des informations linguistiques d'un terme préalablement choisi en plusieurs langues, en utilisant des ressources informatiques.

    Cet ensemble d'opérations constitue la base des activités des professionnels du traitement automatique des langues. Dans leurs métiers, il s'agit très souvent de repérer un terme dans un grand corpus, pour ensuite réaliser des traitements linguistiques, relever des informations lexicométriques, entre autres.

    Dans ce sens, on peut diviser la réalisation du projet en plusieurs parties :

  • Choix d'un terme
  • Choix de langues dans lesquelles on cherchera les traductions du terme choisi
  • Trouver des sites internet qui contiennent le terme choisi
  • Écrire un script en bash et html pour créer des tableaux de résultats
  • Analyser ces résultats

icon

icon

Certaines des étapes citées ci-dessus se subdivisent en sous étapes, chacune avec ses difficultés et particularités. Cela a rajouté de la complexité au travail, et nos connaissances ont été mise à l'épreuve. Mais avec un peu de créativité et des recherches sur le Web nous avons réussi à s'en sortir. Sous l'onglet 'méthode', nous expliquons plus en détails les étapes d’exécution de notre projet.

Celui-ci n'est que le premier projet de maintes autres qui viendront au long de nos carrières.