Bienvenue sur mon site !

31 janvier 2012

 

Le projet encadré consiste à traiter automatiquement des données textuelles multilingues trouvées sur Internet, en se concentrant sur un mot précis. Après avoir récupéré ces données sous formes de pages web, puis en les traitant de façon à ce qu'elles soient exploitables par certains outils (évoqués dans d'autres rubriques), on analyse les occurrences et les contextes du mot choisi (dans mon cas, le mot "suivant" en français, et son équivalent anglais "following".

Sur ce site, vous trouverez un résumé de la démarche qui a conduit jusqu'à l'obtention des résultats présentés (sous forme de tableau, de nuages de mots et d'arbres de mots), ainsi que le code du programme utilisé, et des liens vers plus d'informations sur les différents outils informatiques utilisés, entre autres.