Quand l’intelligence artificielle révolutionne la traduction automatique

 |   |  1086  mots
Systran s'est bien placé dans la course au marché des entreprises, mais ses concurrents sont également dans les starting blocks, notamment SDL, ainsi que Google et Microsoft. Les deux géants du net américains ont aussi annoncé cet automne le lancement de moteurs neuronaux pour la traduction.
Systran s'est bien placé dans la course au marché des entreprises, mais ses concurrents sont également dans les starting blocks, notamment SDL, ainsi que Google et Microsoft. Les deux géants du net américains ont aussi annoncé cet automne le lancement de moteurs neuronaux pour la traduction. (Crédits : © Regis Duvignau / Reuters)
L’éditeur Systran, dont les équipes de recherche sont installées en France, vient de lancer un moteur de traduction automatique fondé sur un « réseau neuronal » d’intelligence artificielle. Microsoft et Google sont aussi dans les starting-blocks. L’objectif ? Doter la machine de capacités de compréhension et de restitution digne de l’homme. Jusqu’à le remplacer ?

La machine va-t-elle rattraper puis dépasser l'homme dans tous les domaines, même ceux qui exigent des qualités poussées de compréhension, de contextualisation, d'anticipation, de finesse, bref, des caractéristiques profondément humaines ? Au début de l'année, le meilleur joueur de go au monde a été battu à la loyale par une intelligence artificielle de Google. L'exploit paraissait pourtant impossible, mais la machine, dopée à l'intelligence artificielle, au deep learning (apprentissage en profondeur) et enrichie par le big data (analyse des données à grande échelle) a prouvé qu'elle pouvait anticiper le jeu et faire preuve de créativité dans les coups, jusqu'à battre le champion du monde.

L'intelligence artificielle va bouleverser la traduction

Quid de la traduction ? Jusqu'à présent, les traducteurs n'étaient pas trop inquiets pour leur avenir. Car malgré les progrès des logiciels, il était impossible pour une machine de restituer de manière convaincante toutes les subtilités de la langue, du second degré aux jeux de mot, en passant par les multiples expressions intraduisibles par du mot-à-mot. Sans même parler du langage technique et hyperspécialisé, comme dans le droit, l'informatique ou les contrats.

Cela va changer. Comme pour le jeu de go, l'intelligence artificielle progresse à vitesse folle. Si bien que plusieurs entreprises (Google, Microsoft, Systran) ont lancé cet automne, quasi-simultanément, des logiciels de traduction automatique d'une qualité inégalée. Leur secret ? Le NMT, pour Neural Machine Translation. Cet acronyme désigne une intelligence artificielle « neuronale », proche du fonctionnement d'un cerveau humain. Ce qui lui permet d'embrasser la complexité de la langue et de restituer du chinois, par exemple, mieux qu'une personne non-native. Et, à terme, mieux qu'un Chinois lui-même.

Systran lance sa solution de traduction neuronale pour les entreprises

Spécialiste de la traduction automatique depuis quarante ans, l'entreprise sud-coréenne Systran, dont la R&D est basée en France, vient de lancer son propre moteur neuronal, baptisé Pure Neural MT, que l'entreprise revendique comme « le plus abouti du marché ». Disponible en trente langues, sa solution, permet de « traiter la phrase, le paragraphe ou le document dans sa globalité », grâce à un réseau de neurones artificiels unique au monde.

Ce réseau comprend 3.000 lignes de codes, soit davantage, d'après l'entreprise, que celui de Google Translate. Comme dans un cerveau humain, Systran a mis au point des sous-réseaux de neurones, qui sont complémentaires, interconnectés et s'activent au fur et à mesure de l'avancée de la traduction. Ainsi, un premier sous-réseau va traiter la phrase pour en extraire le sens. Un second, spécialisé dans la syntaxe et la sémantique, va enrichir la compréhension. Un troisième va contextualiser le contenu. Un quatrième va attirer l'attention sur les mots-clés... Et ainsi de suite.

« Tous ces sous-réseaux nourrissent le moteur et vont lui permettre de choisir la meilleure traduction possible », explique Jean Senellart, le président de Systran.

Remplacer la traduction "statistique" popularisée par Google

L'entreprise considère son réseau neuronal comme « une innovation radicale », destinée à « remplacer toutes les technologies de traduction existantes ». Effectivement, cette technologie va plus loin que la traduction « statistique » perfectionnée par Google, qui donne des résultats parfois très approximatifs, voire ridicules, avec moult contresens et mauvaise concordance des temps. Car ces anciennes générations de moteurs se basent sur le big data, ou l'analyse d'un énorme volume de données en temps réel, pour repérer les phrases qui reviennent le plus souvent et traduire automatiquement de manière extrêmement rapide.

Au contraire, le réseau de Systran se nourrit de données enrichies, comme l'explique Jean Sennelart:

« Notre moteur s'adapte et s'auto-spécialise. Il comprend les bases d'une langue et s'ajuste au plus près de la terminologie et du métier de ses clients en apprenant en continu sur la base des données qui lui sont confiées. Le chinois de l'informatique, le chinois de juridique et le chinois médical sont presque des langues différentes, mais le moteur va s'y adapter très vite ».

Systran cible uniquement les entreprises. Les grands groupes mondiaux représentent 30% de son chiffre d'affaires. Des firmes comme PSA, Adobe ou Société générale l'utilisent pour traduire leurs contrats et documents internes dans leurs multiples filiales. L'entreprise équipe aussi des sociétés de traduction, qui utilisent sa technologie pour leurs clients.

A la différence de Google, qui se considère propriétaire du texte qu'il traduit, Systran commercialise ses solutions sur la base d'abonnements et permet à l'entreprise d'héberger elle-même le logiciel, ce qui lui donne un avantage compétitif. De fait, Systran travaille avec des sociétés dans la défense, la sécurité et même des services secrets. « Les données clients, les contrats ne peuvent pas être dans le cloud, nous les hébergeons dans nos propres datacenters, explique Cédric Rouvrais, le directeur de l'équipe d'innovation à la direction des services informatiques de la Société générale. Par conséquent, il nous fallait un logiciel de traduction installé en interne, car les données sont trop sensibles »,

Google et Microsoft se convertissent aussi au neuronal

Si Systran s'est bien placé dans la course au marché des entreprises, ses concurrents sont également dans les starting blocks, notamment SDL, mais aussi Google et Microsoft. Les deux géants du net américains ont aussi annoncé cet automne le lancement de moteurs neuronaux pour la traduction.

Révélé en novembre, Google Neural Machine Translation (GNMT) s'attaque, grâce aux réseaux neuronaux d'intelligence artificielle, aux fameuses erreurs et approximations qui font la renommée de Google Translate. Avec ce nouveau système, intégré à l'ancien, Google annonce réduire les erreurs de traduction jusqu'à 85%. Si Google Translate est disponible dans 103 langues, seules neuf ont été adaptées à la technologie GNMT, dont le français et l'anglais, mais aussi le chinois, le coréen, le japonais, le turc, l'espagnol, l'allemand et le portugais. De quoi améliorer une bonne partie des recherches mondiales.

C'est également en novembre que Microsoft a lui lancé son moteur neuronal pour ses traductions automatiques via Skype Translator et Microsoft Translator. Disponible en soixante langues, le système vise à faciliter les conversations groupées. Jusqu'à 100 personnes peuvent converser en même temps en utilisant le logiciel. De quoi séduire les entreprises qui doivent organiser des réunions entre filiales à l'autre bout du monde.

Réagir

Votre email ne sera pas affiché publiquement
Tous les champs sont obligatoires

Commentaires
a écrit le 24/12/2016 à 10:49 :
Franchement ça n'a rien de bon, encore un truc qui va faire baisser le revenu, les compétences et faire disparaitre des professions.

En tant que comptable, en 2008 parler anglais, permettait de toucher 20% de plus en salaire dans la plupart des boites et 30-50% de plus, en cas de langue plus rare.
Aujourd'hui avec google translate, je n'ai même plus besoin d'utiliser l'anglais à l'oral depuis plus de 5 ans, avec mes homologues et clients étranger on passe systématiquement par google par mail, mes souvenirs ne me permette juste de faire les corrections et de baragouiner en leur disant de faire un mail.
Paradoxalement certaines entreprises exigent de parler courrament cette langue, même si en générale c'est seulement pour utiliser l'ERP, parce que les cadres n'osent pas aller dans le volet option paramètre langue du logiciel de peur de se faire virer pour avoir modifié l'ERP... J'ai eu le cas, dans une grosse boite de ma ville, les relations extérieures passaient comme chez les autres par mail exclusivement car je cite : "parler c'est perdre du temps, c'est plus rapide de faire un mail".
Aujourd'hui dans plus en plus d'annonces d'emploi, parler ou non anglais n'apporte plus que le salaire minimum, il y'a juste les langues rares type néerlandais dont je ne sais où les gens l'apprennent étant donné qu'elle n'est enseignée dans aucun collège/lycée de ma ville qui permet encore de toucher un supplément de salaire.

De plus dans les sociétés de traductions, leur offre se dispatche en 2 types : logiciel dit "professionnel" et humain, au vue de certaines traductions de mode d'emploi ils doivent passer par google à mon avis. Quel est l'intérêt de garder un humain pour faire une trad quand les clients sont prêt à payer pour une traduction automatique vaguement compréhensible passé par google... aucun.

En gros ne plus utiliser une compétence, c'est la perdre...
Les boites qui payaient plus, pour ça, abaissent les salaires au minimum, étant donné qu'elles sont de moins en moins nombreuses à en avoir un besoin régulier, poussé et précis...
Énormément de clients de boite de trad sont capable de payer pour une traduction qui leur serait gratuite...
Si c'est pour pousser les particulier à acheter à l'étranger, car il peuvent avoir accès à un sav pas cher avec une fonction francophone systématique la répercussion sera qu'il y'aura plus d'importations, donc moins de boites en france, bien sûr il restera les ingénieurs... Et les droits de douanes.
a écrit le 23/12/2016 à 14:50 :
L'utilisation de réseaux neuronal en hardware existe depuis plus de 30 ans, en particulier pour la reconnaissance vocale ou la reconnaissance faciale. Associé aux processus de Markov, cela concerne la traduction vocale simultanée déjà avancée depuis 15 ans.
J'ai travaillé à plusieurs brevets sur le sujet, aujourd'hui publics.
a écrit le 22/12/2016 à 21:36 :
Beaucoup d’eau va encore passer sous les ponts avant que la machine remplace l'Homme dans le domaine de la traduction/communication. Jusqu'à présent, les pros utilisent des mémoires de traduction, à savoir que le logiciel ne traduit rien, mais se souvient de ce qui a été traduit auparavant. Si on recycle donc un texte comme les états financiers où seuls la date, les chiffres et quelques passages changent, on fait des économies substantielles, car le logiciel sait où sont les changements. En revanche, pour exprimer des façons de dire, des sentiments ou des préférences, aucun logiciel ne sait à ce jour ire. Par conséquent, à moins de simplifier drastiquement le langage (ce qu’on commence à faire avec les bac+2 qui ne savent ni lire, ni écrire correctement) pour n'évoquer que des choses fades, ce qui ferait disparaitre tout le côté créatif de la littérature notamment, il sera difficile de traduire la pensée humaine. D’autres éléments sont également ardus. Par exemple, la CIBC parle de Centre bancaire, la Banque de Montréal parle de succursales et d’autres banques parlent d’agences. Il s’agit là d’un choix bien entendu, mais comment un logiciel va-t-il faire la différence. Actuellement, c’est la mémoire de traduction associée à chaque client, qui fait cette différence. Dans le même registre, on constate qu’en Europe la terminologie financière est en fait la même qu’en anglais, mais au Canada en général et dans d’autres pays francophones, ce n’est pas le cas. Et on voit là les limites du langage, car beaucoup de gens du secteur ne savent pas à quoi correspondent les termes qu’ils utilisent. Bon, il y a aussi du snobisme dans cette démarche :-)
a écrit le 22/12/2016 à 16:53 :
...entreprise sud-coréenne Systran, dont la R&D est basée en France,...
Sans commentaire
Réponse de le 22/12/2016 à 20:15 :
Et alors ? Si une entreprise étrangère installe sa R&D en France, n'est-ce pas une bonne chose ? Mieux vaut qu'elle l'installe ici plutôt qu'ailleurs non ? Systran n'a jamais été une entreprise française.
a écrit le 22/12/2016 à 13:50 :
Au vu de ce qui est dit dans l'article, Systran a l'air de s'appuyer sur des couches logicielles plutôt que sur un véritable "réseau neuronal".
L'air de rien, Google translate est de plus en plus pertinent au niveau des traductions, parceque Google dispose d'infrastructures (volumes de données et puissance de calcul) de plus en plus performantes.
Même si Systran propose un algorithme révolutionnaire, Google aura un avantage décisif sur Systran qui ne pourra rivaliser à long terme. Mais c'est pas grave, Systran se fera acheter à prix d'or par Google et tout le monde sera content.
a écrit le 22/12/2016 à 13:12 :
Il y a du travail car pour le moment les traductions automatiques sont la plupart du temps incompréhensible !
a écrit le 22/12/2016 à 10:53 :
IL est évident que le milieu de décideurs privés gangréné par l'incompétence et la bêtise a besoin d'une "intelligence artificielle", où plutôt d'une programmation affinée puisque l'IA n'existe pas encore, particulièrement solide. Puisqu'ils veulent s'accaparer tous les outils de production et les capitaux c'est la seule solution d'un espoir de sortir de cette profonde crise dans laquelle ils nous ont installé.

Et ça urge...

Merci pour votre commentaire. Il sera visible prochainement sous réserve de validation.

 a le à :