Boite à outils n°4

  • Nous allons donc dès à présent nous servir des résultats de la BàO°3 pour créer des graphes grâce à la fonctionnalité patron2graphe.exe. Donc comme c'est une application .exe, elle ne marchera que sur Windows, alors aux amateurs MAC, vous pouvez vous servir d'une machine virtuelle ou alors des machines de l'université.
  • 1) Traitement des sorties CORDIAL

    • Nous allons nous servir tout d'abord des fichiers en "iso-8859-1" obtenus grâce à CORDIAL.

      Traitement b\film sur les fichiers CINEMA

    • Tout d'abord pour lancer les fichiers, nous allons rechercher graphes des fichiers CINEMA sur l'utilisation du mot "film". Pour nous servir de ceci, pour lancer l'application, on se sert de cygwin, on tape ceci sur le terminal :

    • Nous pouvons ici, l'utilisation de l'encodage "iso-8859-1" en plus du fichier .txt qui contient le mot recherché qui se présente comme ceci : motif=b\film.

    • NOM-ADJ (cliquez sur l'image pour la voir en gros)

    • NOM-NOM

    • NOM-PREP-NOM (cliquez pour voir en gros)

    • Traitement b\crise sur les fichiers POLITIQUE

    • Le lancement se fera de la même manière avec de même l'encodage "iso-8859-1" en plus du fichier .txt qui contient le mot recherché qui se présente comme ceci : motif=b\crise.

    • NOM-ADJ

    • NOM-NOM

      FAIL ! pas de réponse.

    • NOM-PREP-NOM

    • Traitement b\Bourse sur les fichiers MEDIAS

    • Le lancement se fera de la même manière avec de même l'encodage "iso-8859-1" en plus du fichier .txt qui contient le mot recherché qui se présente comme ceci : motif=b\Bourse avec une majuscule.

    • NOM-ADJ

      FAIL ! pas de réponse.

    • NOM-NOM

      FAIL ! pas de réponse.

    • NOM-PREP-NOM

    3) Traitement des sorties treetagger

  • Nous allons maintenant passer à la partie des sorties générées par treetagger. En effet nous avons pu diviser qu'un seul fichier et faire analyser ce seul fichier qui est le fichier : SPORT. Nous avons ainsi procédé de cette manière

  • Nous avons ainsi décidé d'analyser le mot "football" dans cette rubrique en lançant dans le fichier .txt motif=\bfootball. Et aussi, comme les fichiers sont en UTF-8, nous avons lancé l'encodage correspondant.

    • NOM-ADJ

    • NOM-NOM

      FAIL ! pas de réponse.

    • NOM-PREP-NOM

    Contact

    Lien outils

    • TAL PARIS 3
      Site où vous pouvez tout savoir sur le Traitement Automatique des Langues à la Sorbonne-Nouvelle
    • ATALA
      Association pour le Traitement Automatique des Langues
    • PluriTAL
      Site du master Ingénierie Linguistique

    Travaux précedents