← Accueil

SCRIPT - FRANCAIS


► Script principal

- Script principal pour le français

► Scripts supplémentaires

J'ai créé des scripts bash supplémentaires pour concaténer mes fichiers "contextes" et pouvoir effectuer des analyses.

Le premier script a servi à créer un fichier avec tous les contextes concaténés pour pouvoir créer des nuages de mots.
Le deuxième a permis de créer un fichier presque identique mais avec des balises pour pouvoir utiliser iTrameur.

- Script concaténation pour les nuages de mots
- Script concaténation pour iTrameur

Mais ces fichiers contenaient beaucoup de "mots vides" ("stopwords").

J'ai donc créé deux nouveaux scripts avec python pour effectuer un "nettoyage". J’ai importé la bibliothèque « NLTK » de python qui inclut une liste de "stopwords" pour chaque langue. J’ai pu facilement supprimer ces mots vides et générer deux nouveaux fichiers nettoyés.

Pour le fichier à partir duquel j'ai créé les nuages, j'ai aussi choisi de supprimer tous les "mots" qui contenaient des caractères non alphabétiques. Je ne pouvais pas appliquer ce traitement au fichier que je comptais importer sur iTrameur car les balises auraient été supprimées, c'est pourquoi j'ai une fois de plus créé deux scripts différents.

- Script python nettoyage pour les nuages
- Script python nettoyage pour iTrameur

Plan du site   -   Mentions légales   -   Contact