Menu

Newsletters Mon compte

veille_technologique

Comment l'IA révolutionne la traduction

Rémy Demichelis  - REMY DEMICHELIS |

L'histoire de l'intelligence artificielle est intimement liée à celle de la traduction, peut-être parce que savoir donner du sens est ce qu'il y a de plus humain et de plus mystérieux pour la machine.

« La traduction [automatique] marche tant bien que mal, ça n'est pas parfait, mais c'est suffisamment bon pour être utile », déclarait vendredi dernier Yann LeCun, à la tête de la recherche en intelligence artificielle (IA) chez Facebook, dans son intervention au salon VivaTech. Le fait est que lorsqu'un internaute cherche à traduire une phrase via un site Web, le résultat a parfois de quoi laisser perplexe. Mais qui, aujourd'hui, se passerait d'Internet pour cette tâche ?

D'autant que le domaine a connu des progrès spectaculaires au cours des dernières années, grâce à l'utilisation de systèmes d'apprentissage automatique basés sur des réseaux de neurones - la technologie de l'intelligence artificielle la plus en pointe actuellement. Google, incontournable dans le domaine de la traduction gratuite avec son service Translate, fut l'un des premiers à l'employer pour cette tâche. Il a été rejoint par le français Reverso ou l'allemand DeepL (propriétaire de Linguee). Facebook a aussi investi dans le domaine (lire ci-dessous), tout comme Microsoft, Fujitsu, Baidu, etc.

La technologie des réseaux de neurones a été introduite chez Google Translate via son laboratoire Google Brain et grâce aux travaux de Jeff Dean, Andrew Ng, Greg Corrado, Geoffrey Hinton et Quoc Le, figures emblématiques de l'intelligence artificielle. « Pendant dix ans, on utilisait une méthode qui s'appelle 'Phrase Based Machine Translation' " (PBMT) : l'algorithme coupait la phrase en petits morceaux et on traduisait chaque petit bout en adoptant une approche statistique ", explique Julie Cattiau, ingénieur et product manager chez Google Translate.

Sens et contresens

C'est un peu ce qu'un humain fait lorsqu'il colle trop au texte : le naturel de la phrase n'est pas conservé et cela peut donner lieu à des contresens. Avec un réseau de neurones, au contraire, l'algorithme considère la phrase tout entière. Par exemple, les vers de Baudelaire « A la très chère, à la très belle/Qui remplit mon coeur de clarté " étaient traduits « At the very expensive to the very beautiful/Who fills my heart with clarity » - avec l'erreur grossière d'employer le mot « expensive » (« qui coûte cher » en anglais). Le système fondé sur des réseaux de neurones, qui prend en compte le contexte, écrit dorénavant : « To the very dear, to the very beautiful/Who fills my heart with clarity ".

Cette innovation, lancée en 2016, a permis de faire presque autant de progrès qu'en dix ans d'amélioration de la traduction automatique chez Google, raconte le journaliste Gideon Lewis-Kraus, du « New York Times », dans une enquête intitulée « The Great A.I. Awakening ". Grâce aux réseaux de neurones, aujourd'hui, la machine peut découvrir les correspondances entre les langues - sans avoir à reproduire les règles définies par des linguistes, ce qui fut l'approche dominante pendant deux décennies. « Nous n'avons aucune personne dans notre équipe qui soit un professionnel de la traduction ou des langues », indique Julie Cattiau. La firme de Mountain View fait néanmoins appel occasionnellement à des traducteurs, notamment pour rédiger des traductions de langues rares afin de nourrir l'algorithme.

Car, avec les réseaux de neurones, il faut dans un premier temps donner à la machine des milliers de textes à lire dans une langue et leur traduction - c'est la phase d'entraînement. « Dans nos corpus, nous avons pas mal d'articles de journaux, de livres, des documents officiels », indique Julie Cattiau. Google se sert notamment de textes mis en ligne par l'Union européenne, ce qui peut donner un aspect un peu formel aux traductions.

Reverso, de son côté, a fait de même avec les traductions français-anglais du gouvernement canadien, ce qui ajoutait au départ une tonalité québécoise aux résultats. « Il persiste quelques biais », confie Theo Hoffenberg, PDG de Reverso. Pour éviter un langage trop institutionnel, ses algorithmes ont également lu « beaucoup de sous-titres de films» , précise Maxime Chanet, chargé de mission linguistique et diplômé d'une école de traduction.

Après la phase d'entraînement, la machine passe aux exercices pratiques. L'humain lui dit quand elle se trompe ou non. Les « neurones » se mettent alors à jour pour affiner leurs résultats. Il faut s'imaginer une grande démocratie : quand on demande de traduire « cat » de l'anglais au français, chaque neurone qui a mené à la réponse « chat " obtient deux voix pour les prochaines élections, et ceux qui se sont trompés n'ont plus le droit de vote. Mais les voix sont redistribuées si le mot change.

Google, avec ses 140 milliards de mots traduits par jour (de loin sur la première marche du podium) et 103 langues, permet aussi à ses utilisateurs de lui indiquer des erreurs directement sur son site afin de perfectionner le modèle.

D'autres acteurs, qui n'ont pas accès à de telles masses d'informations, préfèrent jouer la carte des traductions professionnelles. C'est le cas de DeepL et Reverso, qui ont développé des solutions BtoB (« business to business ") avec l'espoir que les clients leur feront plus confiance qu'aux géants de la Toile pour préserver leurs données. Ils proposent aussi d'adapter les résultats aux spécificités de l'entreprise en « créant un lexique technique », explique Theo Hoffenberg. Cela permet de disposer d'un outil personnalisé : un architecte voudra traduire en anglais « poignée » (comme une « poignée de porte ») par « doorknob » et non par « handful » (comme une « poignée de sable »).

Les progrès de ces outils de traduction et leur utilisation dans le BtoB constituent-ils une menace ou une aide pour les traducteurs professionnels ? « Ca peut représenter un gain de temps, mais je dois passer derrière dans tous les cas », explique Philip Servini, traducteur professionnel. Lui ne s'en sert presque pas et doute qu'il soit un jour possible de s'exonérer de l'humain, du moins de son vivant : « La traduction n'est pas une science exacte. "

Reste que, sur le marché grand public, la combinaison de ces outils avec d'autres technologies d'IA, comme la reconnaissance vocale ou l'analyse d'images, fait naître des applications spectaculaires. Google Translate permet par exemple d'obtenir la traduction écrite d'une phrase parlée. Avec les écouteurs Pixel Buds, lancés à l'automne dernier aux Etats-Unis (mais pas encore en France), l'utilisateur peut même entendre directement la traduction de son interlocuteur.

« Cette fonctionnalité-là, on la voit comme un premier pas vers un monde où les gens pourraient avoir des conversations très naturelles dans deux langues », indique Julie Cattiau. Le chinois Baidu, de son côté, a développé une sorte de Dictaphone de traduction instantanée qui ne prend que trois langues en charge pour le moment. La bataille de la traduction, ouverte par l'IA, vient à peine de commencer.

Pilot l'oreillette connectée qui traduit en temps réel (interview réalisée en février 2017)

<center><iframe src='http://www.ultimedia.com/deliver/generic/iframe/mdtk/01870326/src/8kuq8u/zone/1/showtitle/1/' frameborder='0' scrolling='no' marginwidth='0' marginheight='0' hspace='0' vspace='0' webkitallowfullscreen='true' mozallowfullscreen='true' allowfullscreen='true'width='560' height='353' allow='autoplay; fullscreen'></iframe></center> 
Rémy Demichelis 
Infos 0
Imprimer
Les articles les plus lus
Succession : menace fiscale sur le transfert de la nue-propriété Industrie - Services 1
Succession : menace fiscale sur le transfert de la nue-propriété

Un article de la loi de finances de 2019 concernant l'abus de droit pourrait toucher les démembremen...

Le buzz des Etats-Unis : le divorce de Jeff Bezos suscite des interrogations pour Amazon Industrie - Services 2
Le buzz des Etats-Unis : le divorce de Jeff Bezos suscite des interrogations pour Amazon

Le fondateur d'Amazon a annoncé se séparer de son épouse mercredi. Un divorce qui pourrait avoir des...

Amazon devient la plus grosse société cotée du monde Finance - Marchés 3
Amazon devient la plus grosse société cotée du monde

A la clôture des marchés lundi soir, le géant du e-commerce valait 797 milliards de dollars à Wall S...

Sécurité sociale : ce qui va changer en 2017 Économie France 4
Sécurité sociale : ce qui va changer en 2017

Les députés procèdent ce mercredi au vote du projet de loi de financement de la Sécurité sociale 201...