Exercice 3 – TEI

"Le but de cet exercice est de créer un fichier XML/TEI à partir d’un document txt obtenu par océrisation du Dictionnaire universel (1690) d’Antoine Furetière. Le but ultime est de pouvoir comparer ce dictionnaire avec la version revue et augmentée par Henri Basnage de Beauval."

Les mots que j'ai choisi pour cet exercice sont CARVI et CASTOREUM.

Fichier XML

Exercice 5 – DUCHN

Le Père Duchesne est le titre de différents journaux qui ont paru sous plusieurs plumes durant la Révolution française. Le plus populaire était celui de Jacques-René Hébert, qui en a fait paraître 385 numéros de septembre 1790 jusqu’à onze jours avant sa mort à la guillotine, survenue le 4 germinal An II (24 mars 1794).

Définir une feuille de style dont le résultat est un document HTML et donnant à voir uniquement le texte.

Définir une feuille de style dont le résultat est un document HTML et donnant à voir uniquement le texte en surlignant les mots dont le lemme est « aristocrate » ou « patriote ».

Définir une feuille de style dont le résultat est un document TXT contenant la liste des mots contenant la séquence « citoy », puis la séquence « patriot » ; compter aussi la fréquence de chacun des mots

Définir une feuille de style dont le résultat est un document TXT contenant la liste des catégories ; compter aussi la fréquence de chacune

Définir une feuille de style permettant d’afficher le texte en surlignant les mots de catégories NOM ou ADJ

Définir une feuille de style dont le résultat est un document TXT contenant la liste des séquences NOM ADJ

Idem avec NOM PREP NOM

Exercice 8 – Regrouper des éléments

Compléter la feuille de style [RegroupeParClassesAnciennete.xsl] pour que le résultat soit un tableau HTML avec un titre occupant toute la largeur du tableau pour chaque classe d'ancienneté, un titre pour chaque colonne et une ligne pour chaque infirmière.

Exercice 14 – Extraction dans les Fils RSS du Monde
14.1 – XSLT

Construire une feuille de styles pour afficher les contenus étiquetés avec TreeTagger

Construire des feuilles de style pour extraire (au format TXT) au moins 3 patrons morphosyntaxiques (de longueurs différentes) sur les mêmes fichiers

Construire une feuille de styles pour afficher les contenus étiquetés avec TreeTagger en mettant au jour un patron morphosyntaxique

14.1 – XQuery

Construire une requête pour extraire les contenus textuels des titres

Construire une requête pour extraire les contenus textuels des descriptions

Construire une requête pour extraire les contenus textuels des titres ET des descriptions

Construire une requête pour extraire les patrons morpho-syntaxiques NOM ADJ

Construire une requête pour extraire les patrons morpho-syntaxiques NOM PRP NOM

14.2 – XSLT

Construire une feuille de styles pour afficher les contenus étiquetés des « titres » uniquement

Peut-on envisager de construire une feuille de styles pour afficher chaque « titre » en regard de sa « description » : par exemple un tableau avec 2 colonnes, à gauche les titres et à droite les descriptions (un alignement en somme) ? si cela n’est pas possible directement, quel est l’alignement minimal que l’on peut mettre en oeuvre ?

Construire des feuilles de style pour extraire (au format TXT) au moins 3 patrons morphosyntaxiques (de longueurs différentes) sur les « titres » uniquement puis sur les « descriptions » uniquement

Construire une feuille de styles pour afficher les contenus étiquetés en mettant au jour un patron morphosyntaxique sur les « titres » uniquement puis sur les « descriptions » uniquement

Construire une feuille de styles pour extraire (au format TXT) les items en relation de dépendance syntaxique de type OBJ (les classer et les compter). Essayer de tenir compte de la différence titre/description

Construire une feuille de styles pour extraire la liste des POS en relation de dépendance syntaxique de type OBJ (les classer et les compter)

14.2 – XQuery


Construire une requête pour compter le nombre de titres, le nombre de descriptions.

Construire une requête pour extraire les contenus textuels des « titres »

Construire une requête pour extraire les contenus textuels des « descriptions »

Construire une requête pour extraire les contenus textuels des titres ET des descriptions

Construire une requête pour extraire au moins 3 patrons morpho-syntaxiques (de longueurs différentes)

Construire une requête pour extraire les items portant une relation de dépendance syntaxique de type OBJ

Construire une requête pour extraire les items en relation de dépendance syntaxique de type SUB (on affichera les formes ou les lemmes connectés par cette relation)

Exercice 15 – Patrons morphosyntaxiques / Relations de dépendance
XSLT

Construire une feuille de styles pour afficher uniquement le texte (sortie TXT)

Construire une feuille de styles pour afficher (au format HTML) le texte en insérant sur chaque item sa POS

Construire une feuille de styles pour extraire (en format TXT) au moins 2 patrons morphosyntaxiques de longueurs différentes

Construire une feuille de styles pour extraire (au format TXT) les items en relation de dépendance syntaxique de type SUJET (les classer et les compter)

Construire une feuille de styles pour extraire la liste des POS en relation de dépendance syntaxique de type SUJET (les classer et les compter)

XQuery

Construire une requête pour extraire les items portant une relation de dépendance syntaxique de type OBJ

Construire une requête pour extraire les items en relation de dépendance syntaxique de type OBJ (on affichera les formes ou les lemmes connectés par cette relation)

Exercice 19 – Ulysse pour finir
XSLT

Ecrire une feuille de styles XSLT pour extraire uniquement le volet anglais de cet alignement (au format txt)

Ecrire une feuille de styles XSLT pour extraire uniquement le volet français de cet alignement (au format txt)

A partir des commandes précédentes, écrire une « commande » pour compter le nombre de mots dans chacun des 2 volets de cet alignement

Après avoir choisi un "mot" anglais ou français, écrire une feuille de styles XSLT pour extraire tous les bi-contextes contenant ce mot (le contexte contenant le mot choisi et sa traduction). Faire une sortie HTML dans laquelle le mot choisi initialement est mis en valeur « graphiquement ».

XQuery

Après avoir choisi un « mot » anglais ou français, écrire une requête pour extraire tous les bicontextes contenant ce mot (le contexte contenant le mot choisi et sa traduction)