Un algorithme pour la résolution d`un jeu bi-matriciel

Transcription

Un algorithme pour la résolution d`un jeu bi-matriciel
Un algorithme pour la résolution d’un jeu bi-matriciel
Aicha Anzi1 , Hicham Lenouar2 , Ramzi Kasri2 , Mohammed Said Radjef1
1
2
Laboratoire de Modélisation et d’Optimisation des Systèmes (LaMOS),
Université de Bejaia 06000, Algérie
{anzi_aicha,msradjef}@yahoo.fr
Département de Recherche Opérationnelle, Université de Béjaia, Algérie.
Mots-clés : Jeu bi-matriciel, équilibre de Nash, problème de complémentarité, programmation DC, DCA.
1
Introduction
La recherche de l’équilibre de Nash est le problème le plus fréquent dans la théorie des jeux.
L’équilibre qui consiste à prendre une seule décision (pure) peut ne pas exister, il sera question
alors de chercher l’équilibre en stratégies mixtes qui constitue une distribution de probabilité
sur tout l’ensemble de stratégies. Pour ce dernier, Nash a montré qu’il existe toujours dans
le cas d’un jeu sous forme normale [4]. Dans ce travail, nous nous intéressons à la recherche
de cet équilibre dans le cas d’un jeu bi-matriciel, c’est-à-dire un jeu fini à deux joueurs, sous
forme normale et à somme non nulle. Pour la résolution de ce type de jeux, il existe plusieurs
méthodes dans la littérature. La plus utilisée est celle de Lemke-Howson qui consiste à résoudre
le problème de complémentarité linéaire (PCL) correspondant au jeu par un processus itératif
similaire à la méthode de simplexe [1]. En se basant toujours sur la transformation du jeu
en un PCL, notre approche consiste en l’application de la programmation DC (Difference
of Convex) et DCA (DC Algorithm) pour résoudre le problème d’optimisation résultant de
cette transformation. La programmation DC et DCA sont des techniques d’optimisation non
convexe développées depuis 1986 par Pham Dinh Tao et Le Thi Hoai An. Ils sont basés sur la
décomposition de la fonction objectif du problème en deux fonctions convexes puis travailler
avec ces deux composantes [2].
2
Approche de résolution
Soit le problème de recherche de l’équilibre de Nash d’un jeu bi-matriciel en stratégies mixtes.
Pour la résolution de ce problème, nous avons utilisé une technique d’optimisation non convexe
qui est la programmation DC ainsi que l’algorithme DCA. Pour ce faire, nous avons d’abord
reformulé le jeu bi-matriciel sous forme d’un PCL [5]. Puis, nous avons transformé ce dernier en
un problème d’optimisation. La modélisation de PCL débouche sur deux classes de problèmes :
les problèmes convexes dont on dispose aujourd’hui d’un arsenal théorique et numérique pour
leur résolution, et les problèmes non convexes dont l’étude est en plein essor. Justement, c’est
là qu’intervient DCA qui semble être le plus puissant algorithme disponible à l’heure actuelle,
adapté à l’optimisation non convexe.
Dans le cadre de ce travail, nous avons considéré quatre formulations du problème d’optimisation associé au PCL, et dont la valeur optimale est égale à zéro lorsqu’il admet une solution
[3] :
1. problème quadratique avec contraintes linéaires
2. problème de minimisation concave
3. problème quadratique avec contraintes simples
4. problème de programmation bi-linéaire
Ces formulations donnent naissance à quatre versions de DCA que nous avons implémentées
et testées sur des jeux bi-matriciels dont l’équilibre est déjà connu dans la littérature et comparées en utilisant des jeux simulés aléatoirement. Nous avons effectué également une étude
comparative avec l’algorithme de Lemke-Howson. Cette étude a montré l’avantage de DCA en
ce qui concerne la vitesse de convergence et la capacité à résoudre des jeux à grand nombre de
stratégies et les résultats obtenus seront présentés en détails lors de la conférence.
Références
[1] C. E. Lemke and J.T. Howson. Equilibrium points of bimatrix games. Journal of the society
of industrial and applied mathematics.12(2) : 413-423, 1964
[2] H. A. Le Thi and T. Pham Dinh. DC programming : theory, algorithms and applications.
The state of the art. Proceedings of the first international workshop on global constrained
optimization and constraint satisfaction. Valbonne-sophia antropolis, France, 2002
[3] H. A. Le Thi and T. Pham Dinh. On solving linear complementarity problems by DC
programming and DCA. Computational optimization and applications. 50(3) : 507-524,
2011
[4] J. Nash. Noncooperative games. The annals of mathematics. 54(2) : 286-295, 1951
[5] R. S. J. Savani. Finding Nash equilibrium of bi-matrix games. PhD thesis, The London
school of econometrics and political science. 2006