Le Trameur et ses humeurs!

Pour agrandir les images, cliquez dessus

Le Trameur - Graphe des cooccurrents

L'analyse des cooccurrences dans notre corpus textuel (fichier DUMP) repose ''sur le fondement que les mots ne sont pas des objets isolés les uns des autres mais qu'ils forment un système de relations syntaxiques et sémantiques qui leur donnent sens''. Le graphe ci dessus nous donne à voir des phénomènes d'attraction lexicales. Le pôle de référence est le participe passé « trouvé ». L'analyseur détecte autour de lui une cinquantaine de cooccurrents.
Certains ne font pas sens, comme par exemple tous les termes en anglais (zone floue). En revanche on notera, sans surprise, une forte attraction (qui fait sens cette fois ci!) entre le pôle et l'auxiliaire avoir ''ai'' et le pronom personnel ''je'' → ''j'ai trouvé''.
On notera aussi une forte attraction du pôle avec les déterminants '' un'', ''une'', ''mes'' ou encore avec la conjonction de subordination ''que'' et l'adverbe ''comment''. On a donc une sur-représentation de mots outils.
Cette analyse cooccurrentielle ne révèle cependant que des informations élémentaires.



Quand les polycooccurrents prennent leur temps...



L'analyse des polycooccurrences nous aura donné du fil à retordre ! En effet le traitement,via Le Trameur, est très long. Nous avons dû procéder à une réduction de la liste initiale des cooccurrents. Voici ce qu'il en ressort :

Le Trameur - Graphe des polycooccurrences

Le résultat produit en sortie n'est pas tout à fait en adéquation avec notre axe de recherche. Il ne nous a donc pas permis d'étoffer notre analyse.
Cependant il aura été intéressant, d'un point de vue pédagogique, d'apprendre à utiliser cette fonction du Trameur.



C'est qui "Le Patron"... syntaxique?



Le Trameur - Graphe d'attraction entre formes lexicales



Nous avons réalisé une extraction de termes sur la base du patron syntaxique .* trouvé .* '' (expression régulière). L'image ci-dessus donne à voir une représentation de l'attraction entre formes graphiques induite par ce patron.

On notera un usage très hétérogène des parties du discours conjointement à la forme ''trouvé''. En effet, cette forme appelle en contexte droit des déterminants, une conjonction de subordination, des noms, des adverbes et même des pronoms. Si toutefois on se réfère à la couleur des flèches, on observe que les parties du discours les plus usitées avec "trouvé" sont :
les déterminants : ''trouvé un'', ''trouvé une'', ''trouvé la'', ''trouvé des''.
La conjonction de subordination que : ''trouvé que''.
L'adverbe : ''trouvé comment''.
Les démonstratifs : ''trouvé cette'', ''trouvé ça'', ''trouvé ceci'', ''trouvé ce''.

Si on regarde de nouveau le tableau des sens présenté dans la démarche de travail, ainsi que le graphe ci-dessus, on peut constater que le sens que prend ''l'expression verbale ''j'ai trouvé'' varie en fonction de la catégorie syntaxique utilisée en contexte droit immédiat.
On peut donc supposer que c'est à travers cette variation de la partie du discours en contexte droit, que l'expression verbale '' j'ai trouvé'' va prendre son sens. Mais aussi en fonction de ce qui se trouve à droite de ce contexte (animé, inanimé, concept, objet etc....).

ex: " j'ai trouvé que {Chirac | ce livre} était très intéressant." → opinion
" j'ai trouvé un {hérisson| iphone} en bas de chez moi." → découvrir par hasard
"j'ai trouvé la {paix| solution}." → découvrir quelque chose que l'on cherchait



Keski se "Trame" pour le portugais?



L'analyse via le Trameur n'a pu être que partiellement réalisée, car la base ne peut être paramétrée en portugais. On a donc lancé un traitement en faisant abstraction des catégories syntaxiques.

Le Trameur - Fréquence de la forme verbale "achei"


Le Trameur - Fréquence de la forme verbale "encontrei"


Le seul point intéressant pour notre analyse aura été de pouvoir comparer la fréquence d'apparition, dans les pages web, des différentes formes que prend j'ai trouvé en portugais, à savoir "encontrei", "achei" et "dei com".
Les analyses du Trameur nous montrent que le terme le plus fréquemment employé est "achei" avec 1151 occurrences. En seconde position on retrouve "encontrei" avec 455 occurrences et pour finir "dei com" qui semble très très peu en usage, du moins sur la toile!
Pour confirmer cette analyse il nous suffira de retourner voir le nuage de mot portugais
Et c'est gagné! L'acception de ''trouver'' par hasard avec l'idée de "percuter", de "heurter" semble beaucoup moins courante que les deux autres.

THE END



Pour conclure nous pouvons dire que nous sommes, globalement, parvenues à répondre à notre problématique de départ. Notre analyse pourrait éventuellement être étendue, notamment grâce à l'utilisation des nombreux outils que met à notre disposition le domaine du traitement automatique des langues. Cependant, pour d'ors et déjà réaliser cette chaîne de traitement, nous avons mis à votre disposition quelques liens utiles.