Boite à outils 3 avec iTrameur
Présentation
Il est aussi possible d'extraire des patrons morpho syntaxiques avec iTrameur. Pour ce faire, on charge dans iTrameur une nouvelle base (option délimiteur de contexte vide). Cette nouvelle base est la sortie texte de la Boîte à Outils 1.
On télécharge alors la base dans l'onglet Export
Une fois la base téléchargée, on va alors l'étiqueter avec Tree Tagger. Toute cette méthode est légèrement différente que la BaO 2 classique, car ici, la segmentation se fait via iTrameur.
Pour l'étiqueter, on lance la commande :
cut -f3 1_tout_0,2-3208,1-0,0-iTrameur-export-base.txt | ~/Tree\ Tager/bin/tree-tagger -token -lemma -no-unknown ~/Tree\ Tager/french-utf8.par >test3208.txt
Cette commande va récupérer la 3ème colone du fichier de base. On va alors la "coller" avec la base initiale, via un script perl.
perl joinBaseEtTag.pl 1_tout_0,2-3208,1-0,0-iTrameur-export-base.txt test3208.txt
On recharge alors la base dans iTrameur.
Dans la rubrique SR/Patron, le logiciel permet d'extraire les patrons.
Les fichiers nécéssaires
Le script perl
On retrouve (ouf) les mêmes formes extraites via les BaOs.