Boite à outils 3 avec iTrameur

Présentation

Il est aussi possible d'extraire des patrons morpho syntaxiques avec iTrameur. Pour ce faire, on charge dans iTrameur une nouvelle base (option délimiteur de contexte vide). Cette nouvelle base est la sortie texte de la Boîte à Outils 1.

Étape 1



On télécharge alors la base dans l'onglet Export

Étape 2



Une fois la base téléchargée, on va alors l'étiqueter avec Tree Tagger. Toute cette méthode est légèrement différente que la BaO 2 classique, car ici, la segmentation se fait via iTrameur.
Pour l'étiqueter, on lance la commande :

cut -f3 1_tout_0,2-3208,1-0,0-iTrameur-export-base.txt | ~/Tree\ Tager/bin/tree-tagger -token -lemma -no-unknown ~/Tree\ Tager/french-utf8.par >test3208.txt

Cette commande va récupérer la 3ème colone du fichier de base. On va alors la "coller" avec la base initiale, via un script perl.

perl joinBaseEtTag.pl 1_tout_0,2-3208,1-0,0-iTrameur-export-base.txt test3208.txt

On recharge alors la base dans iTrameur.

Étape 3



Dans la rubrique SR/Patron, le logiciel permet d'extraire les patrons.

Étape 4

Les fichiers nécéssaires

Le script perl



On retrouve (ouf) les mêmes formes extraites via les BaOs.