Laboratoire d`Automatique et d`Informatique Industrielle de Lille
Transcription
Laboratoire d`Automatique et d`Informatique Industrielle de Lille
Développement d’une IA de jeu générique (type jeux de stratégie modernes) basée sur « Monte-Carlo » Tree Search (MCTS) avec apprentissage automatique de règles expertes Titre : Financement prévu : nom Université/Ecole ou Région et/ou nom organisme (CNRS, Inserm,…) ou autre Cofinancement éventuel : MESR (Co)-Directeur de thèse :C. FONLUPT E-mail : [email protected] Co-directeur de thèse : V. Marion, D. Robilliard, F. Teytaud E-mail : Laboratoire : LISIC – EA 4491 Equipe : CAMOME Descriptif : Les méthodes arborescentes de type Monte-Carlo Tree Search ont montré leur puissance dans l’exploration d’arbres de très grande largeur en se basant sur un échantillonnage de l’espace de recherche ; en particulier, ces techniques sont les seules qui ont permis de réaliser des intelligences compétitives pour un jeu complexe comme le jeu de Go. Au lieu d’explorer de manière systématique toutes les branches d’un arbre dans le cas d’un jeu et d’éliminer les branches en se basant sur des techniques de type A* ou Min-Max, MCTS est une technique se basant sur un adversaire jouant de manière aléatoire. Peu d’informations peuvent être obtenues à partir d’une seule partie générée aléatoirement mais la multiplication de ces simulations a montré une robustesse et d’excellentes performances. Le travail de cette thèse consiste à proposer une IA générique basée sur MCTS permettant de générer un ou plusieurs joueurs dans des jeux complexes de type Euro-Games (Colons de Catane, 7 wonders, San Juan, …). MCTS est en général basé sur un jeu se limitant à deux joueurs (Go, Hex, General Game Playing…), nous nous proposons dans le cadre de ce travail de l’étendre à la problématique multijoueurs et jeux de stratégie modernes qui est plus complexe et entraîne de nombreux problèmes de mise en perspective. En effet, Gardiner et Szita et al ont montré de nombreux écueils subsistent dans l’obtention d’une IA convaincante pour ce type de jeu complexe. Une plate-forme d’expérimentation sera réalisée, écrite dans un langage permettant de spécifier de manière claire les différentes décisions à chaque étape du déroulement du jeu. Cette plate-forme pourra ainsi être réutilisée de manière simple et pratique pour tous les jeux utilisant le langage de proposition de décision défini. Nous nous proposons dans un deuxième temps d’utiliser les nombreuses traces d’exécutions afin d’en extraire des informations pertinentes. En effet, comme MCTS génère des milliers voire des dizaines de milliers d’exécutions, des stratégies pertinentes peuvent être extraites, stratégies menant par exemple à la victoire ou permettant de guider le déroulement du jeu. Cette extraction sera utilisée dans un contexte d’apprentissage. En particulier, il sera possible d’utiliser une grammaire pour engendrer des stratégies lisibles par un joueur humain. Références bibliographiques : Szita; G.M.J-B. Chaslot, P. Spronck. Monte-Carlo Tree Search in Settlers of Catan. In Proceedings of the Twelfth International Advances in Computer Games Conference (ACG'09), Pamplona, Spain, May 11-13, 2009. In Press. R. Coulom. Efficient Selectivity and Backup Operators in Monte-Carlo Tree Search. In P. Ciancarini and H. J. van den Herik, editors, Proceedings of the 5th International Conference on Computers and Games, Turin, Italy, pages 72–83,2006 G. Chaslot, J.-T. Saito, B. Bouzy, J. W. H. M. Uiterwijk, and H. J. van den Herik. Monte-Carlo Strategies for Computer Go. In P.-Y. Schobbens, W. Vanhoof, and G. Schwanen, editors, Proceedings of the 18th BeNeLux Conference on Artificial Intelligence, Namur, Belgium, pages 83–91, 2006 Investigating Monte-Carlo Methods on the Weak Schur Problem Shalom Eliahou, Cyril Fonlupt, Jean Fromentin, Virginie Marion-Poty, Denis Robilliard, Fabien Teytaud Ben Gardiner, 7 wonders agent, a proposal, Thesis, Willamette University, Salem, Oregon A. Rimmel , F. Teytaud and O. Teytaud "Biasing Monte-Carlo simulations through RAVE values", Proc. Comput. Games, pp.59 -68 2010