Maison / Technologie / L'intelligence artificielle de Hanabi de Facebook atteint des résultats de pointe

L'intelligence artificielle de Hanabi de Facebook atteint des résultats de pointe

Facebook AI Research (FAIR) dit qu'il a créé la dernière IA pour atteindre des performances de pointe en jouant au jeu de cartes Hanabi. Le système d'IA atteint un score de 24,61 sur 25, tandis que le meilleur précédent a obtenu 23,92 sur 25. En février, des chercheurs de Google, DeepMind, Carnegie Mellon University et Oxford University a proposé une référence Hanabi et la création de plus d'IA qui peuvent jouer le jeu afin d'atteindre "Une nouvelle frontière pour la recherche en IA."

Contrairement aux autres défis de jeu qui opposent l'IA aux humains, comme les échecs ou Go, Hanabi est un jeu coopératif où les participants jouent ensemble pour travailler vers un objectif commun.

"L'une des choses vraiment passionnantes à ce sujet est que l'amélioration que nous observons est vraiment orthogonale aux améliorations observées avec l'apprentissage par renforcement profond: vous pouvez ajouter cela en plus de toute stratégie, et cela la rendra beaucoup plus forte, »Noam Brown, chercheur sur l'IA sur Facebook, a déclaré à Newstrotteur lors d'une interview téléphonique. «Nous constatons que les résultats sont bien au-delà de ce que nous ou d’autres chercheurs attendions. En fait, les avantages que nous tirons de la recherche sont plus forts que ceux qui ont été obtenus grâce à tous les algorithmes d'apprentissage par renforcement profond qui ont été utilisés dans le passé. »

Hanabi AI de Facebook tire une partie de son intelligence de recherche de Pluribus, une IA Facebook jouant au poker présentée plus tôt cette année qui a battu certains champions humains.

L'équipe d'IA de Facebook a réussi l'exploit en appliquant des techniques de recherche en conjonction avec un apprentissage par renforcement profond. L'algorithme de recherche convertit un problème en un paramètre d'agent unique en obligeant tous les agents sauf un à appliquer une politique convenue, un algorithme d'apprentissage par renforcement appelé schéma directeur. Le plan permet à l'agent de recherche de «traiter la politique connue des autres agents comme faisant partie de l'environnement et de maintenir les croyances sur les informations cachées en fonction des actions des autres», selon un article sur le sujet intitulé «Amélioration des politiques via la recherche dans les jeux coopératifs partiellement observables».

En fin de compte, les chercheurs de Facebook pensent que l'IA semblable à son bot Hanabi pourrait aider les systèmes robotiques, les véhicules autonomes ou les agents conversationnels de l'IA à mieux répondre à l'activité humaine en résolvant les défis de la "théorie de l'esprit", a déclaré Brown. La théorie de l'esprit est l'idée de se mettre à la place d'une autre personne pour déduire sa prochaine action. Un exemple de cela dans le monde réel est que si vous conduisez et que la voiture devant vous s'arrête, vous pouvez déduire ou déduire qu'une personne est sur le point d'entrer dans un passage pour piétons même si vous ne pouvez pas la voir.

«C'est quelque chose qui vient très naturellement aux humains, cette idée de pouvoir se mettre à la place d'une autre personne et comprendre pourquoi ils prennent les mesures qu'ils prennent, ce qu'ils pensent, et même s'ils ne sais pas certaines choses. Mais c'est quelque chose avec lequel l'IA a historiquement vraiment lutté », a-t-il déclaré. "Il y a eu ce long débat sur la question de savoir si les primates ont une théorie de l'esprit et à quel âge les bébés humains développent-ils une théorie de l'esprit, et je pense qu'il est vraiment fascinant de voir enfin ce genre de comportement dans l'IA. Et je pense que cela va être vraiment important si nous voulons déployer l'IA dans le monde réel pour interagir avec les humains parce que les humains attendent ce comportement. "

Dans d'autres informations sur le gameplay et l'IA, la semaine dernière, le maître de Go Lee Sedol a déclaré qu'il prévoyait de se retirer du jeu. Sedol battre AlphaGo de DeepMind une fois dans un meilleur des cinq séries de jeux en 2016, mais prévoit de prendre sa retraite en raison de la montée de l'IA surhumaine qui "ne peut pas être vaincue", selon la BBC.

Source

A propos newstrotteur-fr

Découvrez également

PDG d’Intel: nous sommes confiants dans l’avenir, nous avons généré 3,8 milliards de dollars de revenus d’IA en 2019

Intel a annoncé de solides bénéfices et revenus au quatrième trimestre qui ont dépassé les …

Laisser un commentaire

Do NOT follow this link or you will be banned from the site!