Un algorithme pour la résolution d`un jeu bi-matriciel
Transcription
Un algorithme pour la résolution d`un jeu bi-matriciel
Un algorithme pour la résolution d’un jeu bi-matriciel Aicha Anzi1 , Hicham Lenouar2 , Ramzi Kasri2 , Mohammed Said Radjef1 1 2 Laboratoire de Modélisation et d’Optimisation des Systèmes (LaMOS), Université de Bejaia 06000, Algérie {anzi_aicha,msradjef}@yahoo.fr Département de Recherche Opérationnelle, Université de Béjaia, Algérie. Mots-clés : Jeu bi-matriciel, équilibre de Nash, problème de complémentarité, programmation DC, DCA. 1 Introduction La recherche de l’équilibre de Nash est le problème le plus fréquent dans la théorie des jeux. L’équilibre qui consiste à prendre une seule décision (pure) peut ne pas exister, il sera question alors de chercher l’équilibre en stratégies mixtes qui constitue une distribution de probabilité sur tout l’ensemble de stratégies. Pour ce dernier, Nash a montré qu’il existe toujours dans le cas d’un jeu sous forme normale [4]. Dans ce travail, nous nous intéressons à la recherche de cet équilibre dans le cas d’un jeu bi-matriciel, c’est-à-dire un jeu fini à deux joueurs, sous forme normale et à somme non nulle. Pour la résolution de ce type de jeux, il existe plusieurs méthodes dans la littérature. La plus utilisée est celle de Lemke-Howson qui consiste à résoudre le problème de complémentarité linéaire (PCL) correspondant au jeu par un processus itératif similaire à la méthode de simplexe [1]. En se basant toujours sur la transformation du jeu en un PCL, notre approche consiste en l’application de la programmation DC (Difference of Convex) et DCA (DC Algorithm) pour résoudre le problème d’optimisation résultant de cette transformation. La programmation DC et DCA sont des techniques d’optimisation non convexe développées depuis 1986 par Pham Dinh Tao et Le Thi Hoai An. Ils sont basés sur la décomposition de la fonction objectif du problème en deux fonctions convexes puis travailler avec ces deux composantes [2]. 2 Approche de résolution Soit le problème de recherche de l’équilibre de Nash d’un jeu bi-matriciel en stratégies mixtes. Pour la résolution de ce problème, nous avons utilisé une technique d’optimisation non convexe qui est la programmation DC ainsi que l’algorithme DCA. Pour ce faire, nous avons d’abord reformulé le jeu bi-matriciel sous forme d’un PCL [5]. Puis, nous avons transformé ce dernier en un problème d’optimisation. La modélisation de PCL débouche sur deux classes de problèmes : les problèmes convexes dont on dispose aujourd’hui d’un arsenal théorique et numérique pour leur résolution, et les problèmes non convexes dont l’étude est en plein essor. Justement, c’est là qu’intervient DCA qui semble être le plus puissant algorithme disponible à l’heure actuelle, adapté à l’optimisation non convexe. Dans le cadre de ce travail, nous avons considéré quatre formulations du problème d’optimisation associé au PCL, et dont la valeur optimale est égale à zéro lorsqu’il admet une solution [3] : 1. problème quadratique avec contraintes linéaires 2. problème de minimisation concave 3. problème quadratique avec contraintes simples 4. problème de programmation bi-linéaire Ces formulations donnent naissance à quatre versions de DCA que nous avons implémentées et testées sur des jeux bi-matriciels dont l’équilibre est déjà connu dans la littérature et comparées en utilisant des jeux simulés aléatoirement. Nous avons effectué également une étude comparative avec l’algorithme de Lemke-Howson. Cette étude a montré l’avantage de DCA en ce qui concerne la vitesse de convergence et la capacité à résoudre des jeux à grand nombre de stratégies et les résultats obtenus seront présentés en détails lors de la conférence. Références [1] C. E. Lemke and J.T. Howson. Equilibrium points of bimatrix games. Journal of the society of industrial and applied mathematics.12(2) : 413-423, 1964 [2] H. A. Le Thi and T. Pham Dinh. DC programming : theory, algorithms and applications. The state of the art. Proceedings of the first international workshop on global constrained optimization and constraint satisfaction. Valbonne-sophia antropolis, France, 2002 [3] H. A. Le Thi and T. Pham Dinh. On solving linear complementarity problems by DC programming and DCA. Computational optimization and applications. 50(3) : 507-524, 2011 [4] J. Nash. Noncooperative games. The annals of mathematics. 54(2) : 286-295, 1951 [5] R. S. J. Savani. Finding Nash equilibrium of bi-matrix games. PhD thesis, The London school of econometrics and political science. 2006