Le projet


Choix du mot

La première étape était le choix d'un mot ou d'une expression qui serait le coeur du projet. Question de goûts, question de mode de vie, question de valeurs, question de culture aussi : pourquoi ne pas parler de ce qui nous concerne tous, et que nous mettons en pratique différemment selon notre palais, notre langue ? L'alimentation !

Et pourquoi ne pas corser la préparation, en essayant de voir ce qu'est une alimentation saine pour un francophone, un anglophone, un sinophone et un hispanophone ?


Récolte des URLs

L'idée de départ était de récolter 50 URLs contenant notre expression, par langue. En pratique, le nombre a été plus ou moins respecté : 46 URLs récoltées pour le chinois, 52 pour l'anglais, 96 pour le français et 49 pour l'espagnol. Nous nous sommes réparti la cueillette par langues.

Pendant ces vendanges, nous avons tenté de représenter plusieurs pays par langue (quand c'était possible). Sinon, en pratique, nous avons recueilli les URLs qui étaient en haut de la liste de Google et qui paraissaient pertinente : c'est-à-dire qui possédaient bien le motif recherché, qui avaient assez de texte pour qu'il y ait matière à analyse, qui n'étaient pas des pages d'erreur, ni des pdf.

Problématique

Pourrons-nous, grâce à l'extraction et à l'analyse des données récoltées, débusquer le contexte linguistique d'apparition de l'expression alimentation saine, en français, anglais, chinois et espagnol ? A l'aide de ces contextes, pourrons-nous déceler ce qui, pour un francophone, un anglophone, un sinophone ou un hispanophone, représenter une alimentation saine ?