ToolKit

XML Copy Editor

XML Copy Editor est, comme son nom l'indique, un éditeur XML gratuit et léger. A noter, sa dernière version ne semble pas fonctionner sur Ubuntu 12.04.

Vers la page sourceforge du logiciel

Cordial

Cordial est un correcteur orthographique qui permet également de résumer un texte (extraction des concepts forts), de faire de la statistique, mais aussi d'étiqueter un texte. Pour ce projet, nous utilisons la version 6 (un peu datée) de Cordial Universités.

TreeTagger

Treetagger est un outil qui permet d’annoter un texte avec son lemme et son étiquette morpho-syntaxique (Part-of-speech). Il permet d’étiqueter de nombreuses langues et même des langues non prévues si on lui fournit un lexique et un corpus étiqueté à la main pour son apprentissage. Les langues fournies sont plus nombreuses que Cordial qui ne traite que le français : ainsi peut-on trouver le japonais, le chinois ou le mongol. En encodage, il accepte l'UTF-8 et le latin 1.

Vers la page de TreeTagger

Patron2Graphe

C’est un mini programme qui s'éxécute en ligne de commande Windows et qui permet d’obtenir un graphe d’après une liste de patrons. Il est possible de choisir de faire un graphe qui montre les relations entre chaque formes de la liste du patron, ou de choisir un motif autour duquel constuire le graphe. La sortie de patron2graphe est une image, on peut simplement déplacer les formes pour avoir un arbre propre. L’inconvénient est que l’on ne peut pas zoomer sur les formes.

Vers la page de Patron2Graphe