Cette arcade de 16 jeux pour IA teste ses prouesses de jeu – TechCrunch

Comprendre ce qu’est une intelligence artificielle est l’une des choses les plus difficiles à comprendre. Pour aider à déterminer cela, OpenAI a conçu un ensemble de jeux pouvant aider les chercheurs à déterminer si leur agent d'apprentissage automatique est en train d'acquérir des compétences de base ou, ce qui est tout aussi probable, de déterminer comment truquer le système en sa faveur.

C’est l’un des aspects de la recherche sur l’IA qui ne manque jamais de séduire: la façon dont un agent se plie ou enfreint les règles dans le but de paraître performant face à ce que les chercheurs lui demandent de faire. Tricher, c’est peut-être sortir des sentiers battus, mais ce n’est pas toujours le bienvenu. Un moyen de vérifier est de changer un peu les règles et de voir si le système tombe en panne.

Ce que l'agent réellement Vous pouvez déterminer ce que vous avez appris en vérifiant si ces «compétences» peuvent être appliquées lorsqu’elles sont placées dans de nouvelles circonstances où seules certaines de leurs connaissances sont pertinentes.

Par exemple, supposons que vous souhaitiez savoir si une IA a appris à jouer à un jeu similaire à celui de Mario où elle se déplace correctement et saute par-dessus les obstacles. Vous pouvez changer les choses pour que ça marche à gauche; vous pouvez changer l'ordre des obstacles; ou vous pouvez changer complètement le jeu et faire apparaître aux monstres que l'IA doit tirer alors qu'elle voyage correctement.

Si l'agent a vraiment appris quelque chose à jouer à un jeu comme celui-ci, il devrait être en mesure de récupérer les versions modifiées du jeu beaucoup plus rapidement que quelque chose de complètement nouveau. C'est ce qu'on appelle «généraliser» – appliquer les connaissances existantes à un nouvel ensemble de circonstances – et les humains le font constamment.

Les chercheurs OpenAI ont souvent rencontré ce problème dans leurs recherches. Afin de tester des connaissances généralisables sur l'IA à un niveau élémentaire, ils ont conçu une sorte d'arcade de l'IA dans laquelle un agent doit faire ses preuves dans une variété de jeux concepts de gameplay.

Les 16 environnements de jeu qu'ils ont conçus sont similaires aux jeux que nous connaissons et aimons, comme Pac-Man, Super Mario Bros., Asteroids, etc. La différence réside dans le fait que les environnements ont été entièrement conçus pour le jeu avec des commandes, des récompenses et des graphiques simplifiés.

Chaque imposition des capacités d'une IA d'une manière différente. Par exemple, dans un jeu, il peut ne pas y avoir de pénalité pour rester immobile et observer l'environnement du jeu pendant quelques secondes, alors que dans d'autres, cela peut mettre l'agent en danger. Dans certains cas, l'IA doit explorer l'environnement, dans d'autres, il peut s'agir d'un seul et même grand vaisseau spatial. Mais ils sont tous conçus pour être des jeux indéniablement différents, à la différence de ce que vous pourriez trouver pour une console Atari ou NES (bien qu’évidemment un peu différent de celui-ci).

Voici la liste complète, comme on le voit dans le gif ci-dessous de haut en bas, de gauche à droite:

  • Ninja: Grimpez dans une tour en évitant les bombes ou en les détruisant avec des étoiles.
  • Coinrun: Obtenez la pièce à droite du niveau tout en évitant les pièges et les monstres.
  • Pillage: Tirez des boulets de canon depuis le bas de l'écran pour frapper les navires ennemis et éviter les matchs amicaux.
  • Caveflyer: Naviguez dans les grottes à l’aide de commandes de style astéroïdes, tirez sur les ennemis et évitez les obstacles.
  • Sauteur: Jeu de plateforme en monde ouvert avec un lapin à double saut et une boussole pointant vers le but.
  • Mineur: Creusez dans la terre pour trouver des diamants et des blocs obéissant aux règles de gravité de l’ère Atari.
  • Labyrinthe: Naviguez dans des labyrinthes générés de manière aléatoire de différentes tailles.
  • Gros poisson: Mangez des poissons plus petits que vous pour devenir les plus gros, tout en évitant le même sort.
  • Chaser: Comme Pac-Man, mangez les points et utilisez des granulés puissants de manière stratégique pour dévorer vos ennemis.
  • Starpilot: Gradm-shmup se concentrait sur l'esquive et l'élimination rapide des navires ennemis.
  • Bossfight: Bataille un contre un avec un vaisseau principal avec des attaques choisies au hasard et des boucliers régénérateurs.
  • Braquage: Naviguez dans un labyrinthe avec des serrures colorées et les clés correspondantes.
  • Fruitbot: Gravissez les niveaux tout en ramassant des fruits et en évitant les fruits.
  • Dodgeball: Déplacez-vous dans une pièce sans toucher les murs, frappez les autres avec des balles et évitez de vous faire toucher.
  • Grimpeur: Grimpez sur une série de plates-formes en collectant des étoiles le long du chemin et en évitant les monstres.
  • Leaper: Jeu de croisement de voies de type Frogger avec voitures, bûches, etc.

Vous pouvez imaginer qu’une intelligence artificielle pourrait être créée et qu’elle excelle dans les réseaux basés sur la grille comme Heist, Maze et Chaser, mais perd la piste dans Jumper, Coinrun et Bossfight. Juste comme un humain – parce que chaque compétence implique différentes compétences. Mais il en existe aussi: comprendre que le personnage du joueur et les objets en mouvement peuvent avoir des conséquences ou que certaines zones de la zone de jeu sont inaccessibles. Une IA qui peut généraliser et s’adapter rapidement apprendra à dominer tous ces jeux en moins de temps qu’une autre qui ne se généralise pas bien.

L’ensemble de jeux et de méthodes permettant d’observer et d’évaluer les performances des agents qu’ils utilisent est appelé le repère ProcGen, car les environnements et les emplacements ennemis dans les jeux sont générés de manière procédurale. Vous pouvez en savoir plus sur eux, ou apprendre à construire votre propre petite arcade d’IA, sur la page GitHub du projet.

Traduit de la source : https://techcrunch.com/2019/12/03/this-16-game-arcade-for-ais-tests-their-playing-prowess/

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.