Une filiale de Google basée à Londres, Deepmind (« esprit profond ») a développé un logiciel d’intelligence artificielle baptisé DQN (deep-Q-network) capable d’« apprendre » le fonctionnement d’un jeu vidéo simplement en le « regardant ». L’algorithme a été testé sur 49 jeux vidéo sur un Atari 2600, datant des années 1970 et 1980 : des jeux archaïques à l’aune de ce qui se produit aujourd’hui, sans doute, mais qui exigent quand même une certaine complexité de réaction.
L’IA surpasse les humains
L’affaire se complique du fait que le logiciel n’est pas programmé pour connaître les règles des jeux : c’est en les observant qu’il doit lui-même déterminer ce qui rapporte le plus de points et réagir en conséquence. Dans 23 jeux sur les 49, le logiciel a affiché des performances supérieures aux meilleurs scores de joueurs humains professionnels.
L’algorithme fonctionne sur le modèle d’un réseau neuronal profond chargé d’observer le jeu, associé à une technique d’« apprentissage de renforcement » qui « récompense » le système lorsque celui-ci agit d’une certaine manière, tout comme le joueur est récompensé par des scores plus élevés.
Google Deepmind fait observer les jeux vidéo en guise d’apprentissage
Le logiciel d’intelligence artificielle a ainsi surpassé les scores de joueurs humains aux jeux de casse-briques, de boxe et de pinball et notamment le classique Breakout où il a « trouvé » lui-même le moyen de percer des tunnels dans les murs de briques pour se servir des rebonds contre la paroi du fond. « Ce fut une grosse surprise », assure de cofondateur de Deepmind, Demis Hassabis : « Cette stratégie est issue totalement du système sous-jacent » du logiciel. DQN bat également l’homme à plate couture au jeu d’arcade Space Invaders, sorti en 1978.
Si des formes primitives d’intelligence artificielle jouent depuis bien longtemps à certains jeux, comme le backgammon, il y a dans le nouveau logiciel une capacité de traitement de données qui les surpasse de très loin. Capable d’analyser quelque 2 millions de pixels de données par seconde, le logiciel Deepmind.
L’intelligence artificielle « DQN » : du jeu aux autres activités humaines
Bien évidemment, le développement d’un logiciel comme DQN par Deepmind n’a pas pour but de créer des programmes capables de battre les hommes aux jeux vidéo. La filiale de Google n’a pas communiqué sur les objectifs réels de ces études, mais la masse des données dont dispose le géant de la recherche sur internet suggère des applications possibles, tout comme ses programmes de développement de voitures sans chauffeur humain. Michael Cook, de l’University of London, souligne qu’un membre de l’équipe Deepmind indiquait récemment que la technologie qu’elle développe est déjà utilisée par sept produits Google. On ne sait pas lesquels, mais s’il s’agit de logiciels qui « regardent » des écrans ils sont probablement liés à l’exploitation de données d’images et de vidéo, estime-t-il.
Les concepteurs de DQN ont publié le résultat de leurs travaux dans la revue Nature, mercredi, indiquant notamment que Deepmind s’intéresse aux traitements de données relatives au climat et à la santé.
Pour l’heure, la prochaine étape consistera à faire jouer DQN à des jeux plus complexes et plus récents, avec le défi de la 3D.