Ce site présente le projet qu’il nous a été demandé de réaliser dans le cadre de l’UE « projet encadré » du master Plurital.

Il s’agit de créer une chaîne de traitement pour récupérer quelques pages web et en extraire le résultat pour une analyse humaine postérieure. La technologie à utiliser était imposée : bash.

L’analyse est elle à réaliser avec le logiciel Le Trameur, réalisé par des chercheurs de Paris 3.

Les principales difficultés rencontrées dans ce projet sont artificielles : elles tiennent à l’inadaptation du langage à la tâche demandées (cf. Cheminement).

Organisation du site

L’onglet Cheminement vous indiquera les difficultés rencontrées ainsi que les solutions mises en œuvres pour les contourner.

Les pages téléchargées sont listées dans un tableau accessible via l’onglet éponyme.

Nos analyses linguistiques sont regroupées dans la partie Résultats, quant au script utilisé il est accessible depuis l’onglet dédié.

Enfin le dernier lien de la barre de navigation vous permet d’accéder au blog que nous avons tenus lors du développement.

Bonne lecture :)