#!/usr/bin/perl #---------------------------------------------------------------------------------- # MODE D EMPLOI : perl Bao3-relation.pl sortieudpipe-slurp_3208.txt.xml "obj" > sortie-OBJ_3208.txt # En entrée : sortie UDPIPE formatée en XML + une relation syntaxique # En sortie la liste triée des couples Gouv,Dep en relation #---------------------------------------------------------------------------------- use strict; use utf8; binmode STDOUT, ':utf8'; #------------------------------------------------------------------------------------- my $rep="$ARGV[0]"; my $relation="$ARGV[1]"; my %dicoRelation=(); #------------------------------------------------------------------------------------- # on découpe le texte par phrase (liste d'items annotés et potentiellement dépendants) $/="
"; open my $IN ,"<:encoding(utf8)","$ARGV[0]"; while (my $phrase=<$IN>) { #------------------------------------------------------------------------------------- # on traite chaque "paragraphe" en le decoupant "items" my @LIGNES=split(/\n/,$phrase); for (my $i=0;$i<=$#LIGNES;$i++) { # si la ligne lue contient la relation, on ira chercher le dep puis le gouv if ($LIGNES[$i]=~/