Un système informatique autodidacte bat l’Homme à Space Invaders

3e4fd8e8b2e14795d77f3148a2c6ef7906e62e7e.jpg
à plate couture à certains jeux vidéos (Photo : Oliver Berg)

[25/02/2015 20:10:50] Paris (AFP) Un système informatique capable d’apprendre tout seul est parvenu à battre l’Homme à plate couture à certains jeux vidéos, comme l’iconique Space Invaders, une étape importante dans le développement rapide de l’intelligence artificielle (IA).

Cette performance, réalisée par DeepMind (Google), ouvre la voie à des développements futurs dans la vie courante mais aussi dans des secteurs (climat, santé) impliquant la gestion de masses de données, assure la société, qui a publié ses travaux mercredi dans la revue Nature.

“C’est la première fois qu’on conçoit un système d’apprentissage général unique qui soit capable d’apprendre directement à partir de l’expérience pour maîtriser ensuite une vaste gamme de tâches difficiles”, a déclaré Demis Hassabis, co-fondateur de DeepMind, lors d’une conférence de presse à Londres, retransmise sur le site de Nature.

Le nouveau système de la société britannique, rachetée en 2014 par le géant américain de l’internet, est basé sur un algorithme et conjugue plusieurs techniques d’apprentissage informatique avec des mécanismes inspirés du fonctionnement des réseaux neuronaux.

A partir d’informations minimales, cet “agent d’intelligence artificielle”, baptisé DQN (deep-Q-network), est parvenu à apprendre tout seul plusieurs jeux vidéo, à travers l’expérience et la mémorisation, au point d’égaler, voire de surpasser, les hommes dans une bonne partie des cas.

Il se révèle meilleur qu’un joueur expérimenté à 29 jeux classiques développés par le Japonais Atari, notamment Space Invaders et Breakout. Mais il fait moins bien pour le moment pour les 20 autres. Le jeu Asterix lui résiste encore mais pour combien de temps?

En 1997, le supercalculateur Deep Blue avait déjà vaincu aux échecs le Russe Garry Kasparov, alors champion du monde. En 2011, le programme informatique Watson avait gagné un jeu télévisé américain.

“La différence avec Deep Blue et Watson, c’est qu’ils sont en partie préprogrammés”, a relevé Demis Hassabis. “Pour Deep Blue, ce sont des informaticiens et des joueurs d’échecs qui ont instillé la connaissance de ce jeu au programme”, a expliqué ce neuroscientifique britannique de 38 ans, concepteur de jeux vidéos.

“Nous, nous avons construit des algorithmes qui apprennent à partir du terrain”. “Les concepteurs et les programmateurs n’ont pas besoin de connaître eux-même la solution”.

– ‘Comme un bébé’ –

DQN a reçu uniquement des informations sur les pixels (image) et sur les scores. “Au départ, il était un peu comme un bébé, ouvrant les yeux et découvrant le monde pour la première fois”, explique Demis Hassabis. “Il a appris en pressant des touches au hasard et en repérant quand cela lui permettait d’avoir de bons scores”, ajoute Vlad Mnih de DeepMind.

A Breakout, jeu de casse-briques de 1976, DQN a même fini par imaginer une technique très efficace (en creusant un tunnel), une stratégie qui a épaté les informaticiens.

DeepMind, fondée en 2011, avait présenté une première ébauche de résultats sur DQN peu avant son rachat par Google pour une somme évaluée à 400 millions de livres (546 millions d’euros d’aujourd’hui).

Cette fois-ci la gamme de jeux est beaucoup plus étoffée.

DQN a expérimenté des jeux de la fin des années 1970 et des années 1980. Elle va s’attaquer à présent à des jeux des années 1990 en 3D, “nettement plus compliqués”, reconnaît Demis Hassabis. “On y arrivera dans les cinq ans”, prédit-il.

“L’idée, c’est que si l’algorithme permet de simuler la conduite dans un jeu de course automobile, potentiellement avec quelques améliorations, il devrait être capable de conduire une vraie voiture”.

Mais cela va “plus loin que ça”. Cela pourrait permettre de prendre des décisions rapides dans des situations impliquant de nombreuses données, dit-il.

“Cela peut consister à demander à votre téléphone d’organiser un voyage en Europe. Il se chargera de réserver les vols et les hôtels pour vous”.

“Dans le futur, utiliser ce type d’intelligence artificielle devrait nous aider dans des domaines comme l’étude des maladies et les questions climatiques, qui impliquent des données nombreuses et très complexes”, estime Demis Hassabis.