Aller au contenu

          L'intelligence artificielle au service de la traduction automatique

          L'intelligence artificielle au service de la traduction automatique
          Source image: Google

          Pour se rapprocher de la perfection, les outils de traduction automatique incorporent à leurs algorithmes des mécanismes de plus en plus proches de la réflexion humaine.

          Longtemps, les résultats des outils de traduction automatique étaient plus drôles qu'utiles. Phrase incohérente, contresens et autres approximations ne permettaient pas une traduction fluide. Mais les progrès rapides de l'intelligence artificielle sont en train de changer la donne. Disponible en 103 langues, soit 99% de celles parlées dans le monde, Google Translate est le fer de lance de cette révolution.

          Utilisé par 500 millions d'internautes chaque mois, le service fête aujourd'hui ses dix ans et entre dans une ère nouvelle. Depuis mi-novembre, Google Neural Machine Translation (GNMT) a intégré à son application, pour réduire les erreurs de traduction à un taux variant entre 55 % et 85 %. Cette technologie basée sur les réseaux neuronaux informatiques est conçue pour répliquer le cerveau humain. Il ne considère plus les phrases mot à mot mais dans leur globalité, pour les traduire le plus fidèlement possible.

          Responsable monde de Google Translate, Barak Turovsky voit en cette innovation la troisième phase de rupture pour la traduction automatique. Son équipe, basée à Mountain View (Californie), est constituée d'une cinquantaine d'ingénieurs et chercheurs qui collaborent avec l'équipe Google Brain de Zurich. «En dix ans, nous sommes progressivement passés de la traduction mot-à-mot, utile mais hachée et imprécise, à une traduction basée sur des fragments de phrases, le Phrase-Based Machine Translation (PNMT). Le Google Neural Machine Translation (GNMT) permet aujourd'hui une approche plus globale de la traduction», explique-t-il au Figaro. «La précision de celles réalisées grâce à cette technologie se rapproche progressivement de celle des humains.»

          Neuf langues sont pour le moment concernées par le GNMT: l'anglais, le français, l'allemand, l'espagnol, le portugais, le chinois, le japonais, le coréen, et le turc. L'outil est donc utile pour plus d'un tiers de la population mondiale, et 35% des requêtes traitées par Google Translate.

          Des règles linguistiques auto-apprises

          Si le passage de Google au GNMT a été remarqué, le groupe n'est pas le seul à se pencher sur les promesses des réseaux neuronaux. «Un grand nombre d'entreprises spécialisées dans la traduction développent actuellement un outil de Neural Machine Translation», indique François Massemin, vice-président des Opérations de SYSTRAN, une entreprise française qui lance un moteur traduction neuronal avec plus de trente langues. À chacun sa spécialité néanmoins. Le moteur de SYSTRAN privilégie la spécialisation. «Nous alimentons nos algorithmes de la terminologie des domaines d'activité de nos clients, qu'il s'agisse de l'automobile, de l'industrie, de la chimie ou encore du tourisme. Ils s'entraînent et auto-apprennent à partir de corpus spécifiques et des segments de phrases préalablement traduits par un humain.» Parmi les clients de SYSTRAN, des grandes entreprises, dont PSA, Adobe, Symantec ou la Société Générale, mais aussi des services de renseignement avides de connaître la teneur des messages échangés en ligne.

          Google et ses concurrents se gardent bien de livrer la recette de leurs moteurs neuronaux. «Une nouvelle génération de puces [les TPU, ndlr] et des algorithmes sont combinés pour les faire fonctionner», détaille à peine Barak Turovsky. «Ces puces jouent un grand rôle dans la vitesse de traduction. Au lancement de Google Translate par moteurs neuronaux, celle-ci était 100 fois plus lente qu'aujourd'hui», spécifie-t-il.

          Si les technologies d'analyse ont changé, l'approche des données recueillies sur Internet pour alimenter les algorithmes est toujours la même. «Même il y a dix ans, au lancement de Google Translate, nos algorithmes s'alimentaient de textes traduits trouvés sur Internet, en parcourant le Web. Parmi les documents analysés, des livres mais aussi des articles ou le contenu des déclarations des Nations Unies», rapporte Barak Turovsky.

          De ces textes sont déduits des modèles statistiques à répliquer lors d'une traduction. Les réseaux neuronaux ont cela de particulier qu'ils pourront apprendre par eux-mêmes. Autre innovation majeure, ils pourront bientôt traduire une langue à partir d'autres. «Imaginons que l'on dispose de données entre l'anglais et le japonais, entre l'anglais et le coréen mais pas entre le coréen et le japonais. Le modèle multi-langues nous permettra, une fois lancé, de faire une traduction directe entre le coréen et le japonais, alors même que l'algorithme n'a pas été entraîné à traduire entre ces deux langues.»

          En d'autres termes, Google crée une autre langue, baptisée à de nombreuses reprises «interlangue», pour traduire deux langues sans qu'on lui ait appris. Ce concept est aussi appelé «zero-shot». Une avancée que les chercheurs qualifient eux-mêmes de «surprenante» et qui évite l'intégration laborieuse de données.

          De nouvelles expériences de traduction

          Considérables, les progrès de Google Translate ces dix dernières années n'empêchent pas, à l'occasion, l'occurrence d'erreurs de traduction, parfois étonnantes. Début 2016, certaines traductions de l'ukrainien vers le russe donnaient pour résultat le mot «Mordor» pour Ukraine, ou «occupant» pour russe, probablement sous le coup d'une manipulation humaine.

          Pour ces cinq prochaines années, Barak Turovsky envisage trois pistes essentielles de travail: conquérir davantage d'utilisateurs, développer de nouvelles expériences de traduction, à l'image de WordLense qui traduit automatiquement le contenu texte de photos, ou de Tap to Translate, qui s'intègre aux applications pour accélérer le passage d'une langue à l'autre lors de discussions entre étrangers. Mais aussi, continuer à améliorer la qualité de la traduction.

          Pour ce faire, il considère la contribution humaine permise par les outils de Google Translate «plus utile que jamais». «Il y a deux ans, certains ressortissants du Kirghizistan ont réclamé l'intégration du kirghize à Google Translate, mais nous n'avions pas assez de données sur cette langue. Nous leur avons indiqué qu'ils devraient pour cela réaliser la traduction et la validation de deux millions de phrases, ce qui semblait impossible. Mais le message a été repris par le gouvernement et, très rapidement, nous avons pu dénombrer 200.000 traductions par jour. Leur langue a finalement été rendue disponible.»

          L'intérêt de SYSTRAN pour les langues les plus rares est restreint à des pratiques de surveillance. «Nous sommes attentifs au développement de langues telles que l'arabizi et le rusizi», notre François Massemin. «Elles concernent ceux qui parlent l'arabe et le russe mais ne sont pas en mesure de l'écrire en alphabet arabe ou cyrillique. Ces langues intéressent beaucoup les services secrets.» À terme, la comparaison entre une traduction humaine et automatique relèvera essentiellement de la qualité du style.

          Le Figaro Premium

          Abonnez-vous pour 1€ seulement

          Annulable à tout moment

          Réagir à cet article

          23 commentaires
          • Avatar Abonné
            Helen Garnier

            Dans les 2 exemples "Google Translate" reproduits, l'ancienne traduction contient une erreur de syntaxe mais la nouvelle est impeccable.

          • lotariev

            puisqu'elle est artificielle, il faut travailler pour que l'intelligence améliore la pensée humaine, cela rendrait grand service aux politiciens qui courent après les idées.

          • Caroline Subra-Itsutsuji

            Le style, c'est la valeur ajoutée par excellence du traducteur humain ("biotraducteur" pour les intimes), outre le discernement. En traduction, comme en journalisme d'ailleurs, l'intelligence artificielle est une imposture. Pour longtemps.

          • Loïc Lacressonniere

            Vu que les américains ont du mal à comprendre d'autres langues j'imagine que les progrès en TALN sont une priorité pour la surveillance de masse.

          • Dodo128

            C'est bien, encore un peu et Google me mettra au chômage...

          • Autrement qu’ainsi

            Je ne comprends pas qu'on puisse réellement s'imaginer qu'une machine puisse traduire correctement un jour. A mon avis, il y a plus de chances que les hommes renoncent à tout humour, toute référence implicite, toute expression imaginée légèrement ou franchement détournée, bref, à leur langue pour adopter un simple code aisément déchiffrable par une machine. C'est vraiment dommageable de propager cette idée absurde auprès du grand public, et ça a aussi de plus en plus de conséquences néfastes sur la profession.

          • Avatar de PATUREL BRIGITTE

            PATUREL BRIGITTE

            La traduction automatique n'est pas encore de haut niveau, il y a certaines langues ou le Français traduit en Russe laisse à désirer

          • Avatar Abonné
            féal

            Il y a encore du chemin à faire, car il y a des langues (allemand notamment, mais bien d'autres aussi) qui me font hurler de rire...

          • Avatar de KAISADIRE

            KAISADIRE

            Encore très imprécise et expérimentale la traduction automatique ... ce n'est pas ce qu'on croit ...

          • Sir G

            Je me suis amusé à faire traduire plusieurs paragraphes de l'article par Google Translate. Les progrès sont effectivement assez impressionnants, et l'outil commence à être utilisable, à condition de procéder à une relecture attentive du résultat, car il reste du chemin à parcourir, comme en atteste la traduction de la phrase "De ces textes sont déduits des modèles statistiques à répliquer lors d'une traduction" par "These texts are deduced from the statistical models to be replicated during a translation", cherchez l'erreur...

          • pascapple

            L'utilisation de la traduction automatique Google ou Facebook est toujours un grand moment de rigolade... qui plus est, c'est gratuit et à la portée de tous.
            Mais l'optimisme des informaticiens m'étonnera toujours... parler de réseaux neuronaux alors qu'ils sont grosso modo en train d'enregistrer des phrases toutes faites, c'est quand même très fort!

          • Henriette du Mans

            Bien utile, mais peut mieux faire pour traduire oralement et en temps réel, la langue de bois de nos très coûteux politiques qui que savent toujours quoi pas dire.

          • Swordy

            Certes le génie logiciel national à laissé de sérieuses références, comme le langage Prologue, né en France, qui a été conçu par Alain Colmerauer et Philippe Roussel début des années 70, et continue d'être utilisé dans le traitement de données linguistiques. C'est l'un des excellents langages de l'intelligence artificielle de syntaxe facile et intuitive, initialement fondé sur les Clauses de Horn, il utilise le calcul des prédicats du premier ordre, avec d'autres évolutions apportées par le développement d'applications spécialisées.

          • Louis Sergent

            Quels sont les meilleures applications et logiciels de traductions ? Merci ! Et merci également pour votre article très intéressant !