Exercice 14

Extraction dans les Fils RSS du Monde  :

Part 1

XSLT

1. Construire une feuille de styles pour afficher les contenus étiquetés avec TreeTagger.
2. Construire des feuilles de style pour extraire (au format TXT) au moins 3 patrons morpho-syntaxiques (de longueurs différentes) sur les mêmes fichiers.
3. Construire une feuille de styles pour afficher les contenus étiquetés avec TreeTagger en mettant au jour un patron morphosyntaxique.

XQUERY

1. Construire une requête pour extraire les contenus textuels des titres.
2. Construire une requête pour extraire les contenus textuels des descriptions.
3. Construire une requête pour extraire les contenus textuels des titres ET des descriptions.
4. Construire une requête pour extraire les patrons morpho-syntaxiques NOM ADJ.
5. Construire une requête pour extraire les patrons morpho-syntaxiques NOM PRP NOM.

Part 2

XSLT

1. Construire une feuille de styles pour afficher les contenus étiquetés des « titres » uniquement.
2. Peut-on envisager de construire une feuille de styles pour afficher chaque « titre » en regard de sa « description » : par exemple un tableau avec 2 colonnes, à gauche les titres et à droite les descriptions (un alignement en somme) ? si cela n’est pas possible directement, quel est l’alignement minimal que l’on peut mettre en œuvre ? Construire cet alignement minimal...
3. Construire des feuilles de style pour extraire (au format TXT) au moins 3 patrons morpho-syntaxiques (de longueurs différentes) sur les « titres » uniquement puis sur les « descriptions » uniquement.
4. Construire une feuille de styles pour afficher les contenus étiquetés en mettant au jour un patron morphosyntaxique sur les « titres » uniquement puis sur les « descriptions » uniquement.
5. Construire une feuille de styles pour extraire (au format TXT) les items en relation de dépendance syntaxique de type OBJ (les classer et les compter). Essayer de tenir compte de la différence titre/description.
6. Construire une feuille de styles pour extraire la liste des POS en relation de dépendance syntaxique de type OBJ (les classer et les compter).

XQUERY

1. Construire une requête pour compter le nombre de titres, le nombre de descriptions.
2. Construire une requête pour extraire les contenus textuels des « titres ».
3. Construire une requête pour extraire les contenus textuels des « descriptions ».
4. Construire une requête pour extraire les contenus textuels des titres ET des descriptions
5. Construire une requête pour extraire au moins 3 patrons morpho-syntaxiques (de longueurs différentes).
6. Construire une requête pour extraire les items portant une relation de dépendance syntaxique de type OBJ.
7. Construire une requête pour extraire les items en relation de dépendance syntaxique de type SUB (on affichera les formes ou les lemmes connectés par cette relation).