L’intelligence artificielle appliquée à la traduction : Google en fait un peu trop

Google traduction intelligence artificielle
 
Imaginez que vous puissiez présider un débat entre des personnes parlant simultanément plusieurs langues différentes lors d’une conférence internationale, ou que vous puissiez échanger avec de nouveaux amis venus des extrémités du globe au bar d’un centre de vacances, tout cela même si vous ne parlez qu’une seule langue… Ces rêves – et bien plus – pourraient devenir réalité avec l’apparition d’un petit mais puissant logiciel de traduction, explique Lei Sumei, dans le quotidien anglophone de Pékin Global Times. Le 27 septembre Google a réveillé les inquiétudes sur cette intelligence artificielle (AI) qui prétend pouvoir prendre la place de l’intelligence humaine, en lançant son nouveau Google neural machine translation system (GNMT). Ce « Système neuronal de traduction Google » est présenté comme une « technique de pointe réalisant à ce jour le progrès le plus important en matière de machines à traduire ».
 
Si l’on en croit un rapport technique de Google, GNMT surpasse les systèmes de traduction existants en ce qu’il utilise « une norme de comparaison basée sur une logique humaine » et « prend en compte la signification globale de la phrase comme une unité », présentant ainsi moins de choix complexes. « Les précédents systèmes de traduction étaient basés sur les mots, les phrases et la grammaire, assemblant les termes dans un certain ordre. Or le GNMT est basé sur des réseaux neuronaux récurrents et des mécanismes de l’attention » explique Wang Shijin, directeur adjoint de iFlytek Research, centre de recherches qui développe des technologies de générateurs de voix et de parole, au Global Times.
 

Tous les signifiants compilés pour chaque mot dans le nouveau système de traduction

 
Le « mécanisme de l’attention » lie le décodage de la machine de traduction au processus d’encodage, améliorant le ratio de parallélisme et, de ce fait, accélère la traduction. Par exemple, quand le GNMT traduit une phrase depuis le chinois vers l’anglais, couple de langues présentant des difficultés majeures, le système « encode d’abord les mots chinois comme une liste de vecteurs dans laquelle chaque vecteur porte la signification de tous les mots lus jusqu’ici (encodeur). Pour générer la traduction, à chaque étape, le décodeur s’attache à évaluer la correspondance la plus significative sur les vecteurs chinois encodés avant de générer le mot anglais ».
 
« Le GNMT réduit les erreurs de traduction de plus de 55 % à 85 % sur plusieurs paires des langues les plus usitées, mesurées sur des phrases relevées sur Wikipedia et sur des sites d’information avec l’aide d’évaluateurs humains bilingues », indique un article publié par le site guancha.cn.
 

Google recourt à une combinaison de plusieurs techniques de traduction

 
Ce nouveau système de traduction est l’une des avancées les plus récentes de Google dans le domaine de l’intelligence artificielle après son programme informatique Alpha-Go qui a vaincu le Sud-coréen Lee Se-dol, dix-huit fois champion du monde de jeu de go, par 4 à 1 en mars.
 
Reste que, selon Chen Boxing, chercheur à l’Institut de technologie de l’information du Conseil national canadien de la recherche, le GNMT est encore loin d’être une avancée déterminante dans le domaine de la traduction automatique. « Ce que propose Google, c’est tout simplement de combiner plusieurs des techniques les plus récentes dans le cadre d’un bon système basé sur les grandes capacités de traitement de la compagnie », a écrit Chen sur Sina Weibo le 3 septembre. « En vérité, il n’y a rien de vraiment nouveau », ajoutait-il.
 

Il manque à l’intelligence artificielle le contexte et le raisonnement

 
Wang confirme l’opinion de Chen en affirmant que le GNMT ne parvient toujours pas à inclure le contexte dans le processus de traduction. Selon lui, on dénombre trois degrés de développement en matière d’intelligence artificielle. La capacité de calcul, par exemple traiter l’arithmétique de base ; la capacité à percevoir, en d’autres termes faire accéder l’intelligence artificielle à l’écoute et à la compréhension ; et la capacité à connaître, qui exigerait des machines qu’elles acquièrent la capacité à apprendre, à se souvenir et à associer. « La principale difficulté que nous rencontrons quand nous parvenons au troisième degré, c’est de doter la machine d’une capacité d’intelligence, en d’autres termes d’une capacité de compréhension, d’exploitation, de raisonnement et de prévision », ajoute Wang. Cette frontière reste le talon d’Achille de l’intelligence artificielle.
 
« Bien que les technologies de reconnaissance d’image et de parole – de second degré – aient atteint un niveau de fiabilité proche de 99 %, il reste impossible pour une machine de reconnaître des personnes quand elle les regarde par l’arrière car elle n’a pas la capacité d’associer », précise Wang. Chen, quant à lui, rassure les traducteurs qui craindraient de perdre leur emploi à cause du GNMT. « Ils peuvent s’inquiéter ou avoir peur de la traduction par l’intelligence artificielle comme s’inquiétaient les fileurs de coton quand apparurent les machines à vapeur… mais il n’en reste pas moins que le nombre de fileurs de coton a doublé depuis », sourit Chen.
 

Jérôme Noël