SUR LA THEORIE DES JEUX
Bernard Guerrien
Docteur en mathématiques et en sciences économiques
La microéconomie ne sert à rien - sauf à quelques uns auxquels elle donne l’occasion de multiplier les " analyses " des " comportements " de consommateurs et d’entreprises fictifs, évoluant dans un monde tout aussi fictif, généralement sous la houlette d’un " commissaire-priseur " bénévole mais passablement autoritaire.
Face à ce constat, il est fréquent d’entendre dire : " D’accord, mais tout cela est maintenant dépassé, notamment grâce à la théorie des jeux, qui fournit de nouveaux outils et permet d’avoir une vision plus complexe des interactions, basée sur les stratégies, etc. ". Qu’en est-il exactement ?
Une " théorie " qui est loin d’être nouvelle
La théorie des jeux est, d’une certaine façon, née avant la microéconomie (dans les années 30). Ses textes fondateurs, ceux de Von Neumann et Morgenstern et Nash, datent de la fin des années 40, comme ceux de la microéconomie (de Samuelson à Debreu). Pourquoi donc l’avoir mise en veilleuse pendant 30 ans (disons entre 1950 et 1980), en privilégiant la microéconomie telle que nous la connaissons encore, alors que ceux qui ont développé celle-ci connaissaient parfaitement celle-là - la première démonstation d’existence d’au moins un équilibre général, par Arrow et Debreu, considère l’économie comme un jeu, au sens de la théorie des jeux. A cause de problèmes rencontrés sur le plan mathématique, qu’on aurait (enfin) résolus ? Pas vraiment, puisque le principal résultat de la théorie des jeux, le théorème d’existence de Nash, a été établi au début des années 50. Depuis, une bonne partie de l’activité des théoriciens des jeux a consisté à proposer ce qu’ils appellent des " raffinements " de l’équilibre de Nash, face aux problèmes posés par celui-ci. En fait, ces problèmes sont apparus très rapidement (ils sont déjà largement évoqués dans le livre publié en 1957 par Luce et Raiffa, avec le titre significatif Game Theory : Introduction and Critical Survey) et ils sont insolubles, non pas pour des raisons mathématiques, mais en raison de la nature même de la théorie des jeux (le fait que chacun décide en cherchant à anticiper ce que les autres vont faire - en cherchant eux-mêmes à anticiper, etc. - conduit à envisager une multitude d’issues possibles, avec souvent à la clé " dilemmes " et " paradoxes ").
La théorie des jeux traite-t-elle de ce qui est ou ce qui doit être ?
Une théorie est, selon l’acception courante, un ensemble d’hypothèses ayant trait au monde tel qu’il est (ou tel que le conçoit le théoricien), dans le but d’en expliquer (ou de décrire, ou de prédire) tel ou tel aspect. Toutefois, en sciences humaines - et tout particulièrement en économie - le théoricien s’en tient très rarement à ce qui est : il ne peut s’empêcher de dire ce qui doit être - sa démarche est normative. Alors, quid de la théorie des jeux ? La confusion règne à son propos, certains auteurs prétendant qu’elle cherche à expliquer les phénomènes observés, ou à faire des prédictions, d’autres qu’elle est prescriptive (normative), d’autres encore qu’elle est l’une et l’autre, d’autres (bien moins nombreux) enfin ne se prononçant pas. Quelques exemples.
- Version descriptive :
Eric Rasmussen : " C’est là exactement le paradigme de la théorie des jeux : celui qui construit le modèle attribue des fonctions de gain et des stratégies aux joueurs, puis OBSERVE ce qui se passe lorsqu’ils choisissent des stratégies pour obtenir le gain maximum "(Jeux et informations, 1994, Basil Blackwell).
Ken Binmore : " La théorie (des jeux), telle qu’elle est développée actuellement, est surtout la DESCRIPTION de ce qui se passe lorsque des personnes interagissent rationnellement ".
David Kreps : " l’objet de la théorie des jeux est d’aider les économistes à COMPRENDRE et à PREDIRE ce qui se produit dans différentes situations économiques "(Théorie des jeux et modélisation économique, Dunod, 1992).
- Version normative :
Van Damme : " Game Theory is a normative theory : it aims to prescribe what each player in a game should do in order to promote his interests optimally ".
Luce et Raiffa : " Il est essentiel, pour nous, que le chercheur en sciences humaines sache que la théorie des jeux n’est pas DESCRIPTIVE, mais plutôt (conditionnellement) NORMATIVE. Elle n’établit ni comment les gens se comportent, ni comment ils devraient le faire pour atteindre certains buts. Elle prescrit, avec des hypothèses données, des types d’action qui conduisent à des issues ayant un certain nombre de propriétés qui relèvent de l’ ‘optimalité’ " (italiques et guillements sont des auteurs).
- Mélange des deux :
Encyclopedia Britannica : " A solution to a game PRESCRIBES the decision the players should make and DESCRIBES the game’s appropriate outcome. Game theory serves as a guide for players and as a tool for PREDICTING the outcome of a game "
- Ambigüité :
Osborne et Rubinstein : " Game theory is a bag of analytical tools designed to HELP US UNDERSTAND the penomena that we OBSERVE when decision makers interact ". " Aider à comprendre " est modeste, " observe " suggérant néanmoins qu’on est dans le domaine du descriptif.
- Vague
Robert Aumann (New Palgrave) " This discipline concerns the behaviour of decision makers (players) whose decisions affect each other ". Aumann parle de " décideurs ", mais inclut ensuite les ordinateurs, les animaux et ... les plantes parmi les joueurs possibles. Binmore en fait autant. Comprenne qui pourra...
- Encore plus vague
La théorie des jeux permettrait d’ " éclairer ", ou de faire avancer la réflexion, sur certains problèmes.(le mot anglais " insights ", difficile à traduire, est fréquemment utilisé). Par exemple : Myerson, après avoir dit que la théorie de jeux " provides general mathematical techniques for analysing situations in which two or more individuals make decisions that will influence one another’s welfare ", précise : " as such, game theory offers insights of fundamental importance for scholars of the social sciences " (Game Theory and Analysis of Conflict).
On retrouve l’argument de repli des microéconomistes : la théorie permet de " faire réfléchir " sur les problèmes, même si c’est avec des agents fictifs, dans un monde encore plus fictif. Peut être. Mais alors qu’on ne nous parle pas d’ " outils " - tout aussi fictifs que le monde où ils sont utilisés - ou des problèmes que la théorie des jeux permettrait de " résoudre " - dans des mondes non fictifs.
Cette cacophonie à propos de la nature de la théorie des jeux - sur ce qu’elle " fait " ou permettrait de faire - n’est pas accidentelle : elle découle de ce que, en règle générale, elle ne " résout " rien et ne " propose " rien aux joueurs. Essentiellement, elle attire l’attention sur les problèmes que posent les choix d’individus rationnels en interaction, lorsque toutes les hypothèses des modèles sont spécifiées.
Le cas de l’équilibre de Nash et le (trop ?) célèbre " dilemme des prisonniers " sont, de ce point de vue, très significatifs.
L’équilibre de Nash est-il " la " solution ?
Si les équilibres sont, en règle générale, des situations privilégiées par le modélisateur, c’est parce qu’ils sont, par définition, des situations non éphémères, considérées comme des " points d’attraction " du système (vers lesquels il tend ou " autour desquels " il se " maintient ").
Or les théoriciens des jeux utilisent le mot " équilibre " pour désigner leur principal concept de solution : l’équilibre de Nash, ce qui revient en fait à désigner celui-ci comme " la " solution qui va de soi - quand on a trouvé les équilibres d’un modèle, celui-ci est " résolu ", pour l’essentiel. Mais qu’en est-il exactement ? Car si un équilibre de Nash satisfait la condition minimale de rationalité - chaque joueur maximise ... compte tenu de ce qu’il pense que les autres feront - il n’a rien des caractéristiques d’un équilibre, tel qu’on l’entend habituellement. En effet, s’il y a " équilibre ", c’est parce que chacun anticipe correctement ce que les autres vont faire. En outre, les choix sont faits une seule fois et simultanément : l’idée d’un " processus " menant à l’équilibre - par modifications successives des anticipations - n’a pas de sens dans ce contexte (car si processus il y avait, des joueurs rationnels en tiendraient compte dans leurs choix, ce qui modifierait le processus - si tel n’était pas le cas, alors cela voudrait dire qu’on est ... à l’équilibre !).
Prenons l’exemple phare de la concurrence imparfaite : le modèle du duopole de Cournot. Chaque entreprise fait une offre en anticipant celle de l’autre (et en pensant qu’elle ne la modifiera pas), sans rien connaître à son propos. L’équilibre de Cournot-Nash du modèle est tel que chaque entreprise fait son offre en prévoyant exactement l’offre de sa concurrente sans rien savoir sur elle. Que peut alors prédire le modèle ? Rien, si ce n’est que l’équilibre n’aura jamais lieu - sauf cas très exceptionnel (où chaque entreprise tombe par hasard sur l’offre de l’autre). Le théoricien va-t-il " prescrire " cet équilibre aux entreprises ? Non, puisqu’elles peuvent toutes deux gagner plus en se concertant. Autrement dit, l’équilibre de Nash ne représente ni ce qui est (ou pourrait être), ni ce qui devrait être (du point de vue du profit des entreprises)...
Si on prend l’autre modèle classique du duopole, celui de Bertrand, où les entreprises proposent des prix, alors on peut dire que l’équilibre de Nash n’aura jamais lieu. En effet, l’équilibre de ce modèle est tel que chaque entreprise propose le même prix, égal au coût moyen (supposé constant). Comme à ce prix, leur profit est nul, elles ont toutes deux intérêt à proposer un prix supérieur à ce coût, avec une chance sur deux de faire un profit strictement positif (plutôt que nul) : par conséquent aucune d’entre elles ne choisira la stratégie d’équilibre ! Que peut alors prédire le théoricien ? N’importe quelle combinaison de stratégies peut avoir lieu, SAUF celle qui est un équilibre de Nash ! Il est difficile, dans ces conditions de voir dans celui-ci un " point d’attraction " du système. Sur le plan normatif, le seul conseil que peut donner le théoricien est : " proposez un prix supérieur à celui de l’équilibre de Nash " ! Une fois de plus, celui-ci ne dit ni ce qui est, ni ce qui doit être.
Mais, dira-t-on, ces conclusions n’ont lieu que dans des jeux " simples ", à un seul coup. Pourquoi ne pas supposer des situations plus compliquées, dans lesquelles l’équilibre de Nash " émergerait ", en tant que solution ? Le dilemme des prisonniers répété a été proposé par les théoriciens des jeux pour détruire les illusions à ce propos.
Equilibre de Nash et dilemme des prisonniers
Il est difficile, si ce n’est impossible, d’ouvrir un traité de théorie des jeux - ou un ouvrage de microéconomie qui cherche à présenter celle-ci - sans tomber sur une variante ou une autre du " dilemme des prisonniers " (pour beaucoup, en sciences sociales, théorie des jeux et dilemme des prisonniers sont presque des synonymes). Il est quand même symptomatique qu’une théorie mette en avant un dilemme - par nature, insoluble - dès sa présentation ! Le dilemme tient ici au fait que les stratégies de l’équilibre de Nash apparaissent aux joueurs comme des choix " évidents " (ce sont des stratégies dominantes, chacun le sachant) et pourtant elles ne peuvent être recommandées, car elles résultent en une issue sous-optimale, au sens de Pareto. D’où l’idée de répéter le jeu, pour essayer de sortir de ce dilemme. Mais, ce faisant, on le rend encore plus problématique, puisque tant que les répétitions ont lieu un nombre fini de fois, le seul équilibre de Nash est également sous-optimal - et ce d’autant plus que le jeu est répété un grand nombre de fois. Il devient donc encore plus difficile de recommander les stratégies d’équilibre. Outre le fait qu’elles ne correspondent pas à ce qui doit être, ces stratégies ne représentent pas ce qui est ; en effet, il découle des innombrables expériences faites avec des joueurs en chair et en os, que personne ne choisit la stratégie d’équilibre, si le jeu est répété quelques fois.
Il est vrai que ce " dilemme " peut être levé en supposant que le jeu de base est répété indéfiniment. Mais on se trouve alors devant un nouveau dilemme : le jeu obtenu comporte une infinité d’équilibres (c’est le célèbre " folk theorem "). Comment, et pourquoi privilégier l’un d’entre eux ? Sur quelle base ? On tombe alors sur un des autres problèmes lancinants de la théorie des jeux : la multiplicité des équilibres. A nouveau, tout dépend des croyances de chacun sur ce que l’autre (ou, plus compliqué encore, les autres) fera (feront). En fait, tout peut arriver, comme on peut le voir à travers l’exemple d’un jeu très simple, qui rentre dans la catégorie des jeux de coordination.
Equilibre et coordination
Cet exemple est décrit par le tableau suivant, où on voit que les deux joueurs, A et B, ont intérêt à se " coordonner " sur (a1,b1) ou (a2,b2) plutôt que de ne pas se coordonner (car alors leur gain à tous deux est nul), mais en même temps A préfère l’issue (a1,b1) (où il gagne 2) à (a2,b2) (où il ne gagne que 1), alors que c’est le contraire pour B.
| b1 | b2 |
a1 | (2,1) | (0,0) |
a2 | (0,0) | (1,2) |
Que peut-on prédire sur le choix des joueurs ? Rien ou ... tout ! Car tout dépend de ce que chacun pense de l’autre. Ainsi, si A croit que B est plutôt du genre " dégonflé ", il optera pour a1 ; si sa croyance est correcte, il y aura équilibre de Nash, mais s’il se trompe, alors c’est l’issue la pire qui prévaudra (gain nul pour les deux joueurs). Tout dépend donc des croyances des joueurs, qui sont un paramètre hors modèle (non spécifié par celui-ci). Selon ce que croit chacun sur l’autre, n’importe laquelle des issues peut se réaliser, les joueurs ayant un comportement rationnel. Le modèle n’a pas de " solution " qui s’impose, d’une façon ou une autre.
Quid d’un point de vue normatif ? Là aussi, on ne peut rien dire : le " conseil " que peut donner le modélisateur à A, par exemple, dépend de ce qu’il croit sur B. La seule chose qu’il peut leur dire : vous avez intérêt à vous " coordonner ". Mais sur quoi ? Il n’y a pas de réponse à cette question.
Aller plus loin ?
Nous avons ici évoqué des jeux très simples (Cournot, Bertrand, dilemme du prisonnier, jeu de coordination), à deux joueurs (on évite ainsi le problème, complexe, des coalitions possibles), et chaque fois nous avons pu constater que la théorie des jeux ne propose nullement de " solution " - positive ou normative - à ces modèles. D’où la question : comment une théorie qui ne peut résoudre, quelque soit le sens qu’on donne à ce mot, des problèmes (modèles) très simples pourrait-elle le faire pour des problèmes plus compliqués ? La réponse est évidente ... Pourtant, tout le monde parle de théorie des jeux (même si c’est à 90% des fois à propos du dilemme des prisonniers), il y a de gros traités et même des revues qui portent sur elle. On se dit : ce n’est pas possible, cela doit bien " résoudre " quelque chose. Et bien non ! Ou alors si solution il y a, c’est au sens mathématique. Par exemple, on va construire un modèle plus ou moins compliqué - qui est éventuellement censé représenter une situation concrète (forcément simple) - puis on se posera la question : est-ce qu’il a (au moins) un équilibre (en stratégies mixtes) ? Pour cela on utilisera des théorèmes mathématiques plus ou moins compliqués (du genre point fixe). Supposons que l’existence ait été établie. On pourra alors se demander si l’équilibre est unique - ce qui est l’exception plutôt que la règle - et chercher à le caractériser, voir quelle est sa sensibilité aux variations des divers paramètres du modèle (statique comparative), etc. Voilà de quoi publier, divertir les mathématiciens. Le problème, c’est que beaucoup d’énergie est ainsi consacrée à étudier sous toutes ses coutures une entité particulière, l’équilibre, sans qu’il n’y ait aucune raison - d’ordre positif ou normatif - qui le justifie (le fait de l’appeler équilibre est trompeur, de ce point de vue, comme nous l’avons signalé plus haut). On peut aussi essayer de voir, parmi tous les équilibres, si certains sont plus justifiés que d’autres du point de vue des croyances qui les sous-tendent, ce qui conduit à introduire ce que les théoriciens des jeux appellent des " raffinements " de l’équilibre de Nash. Qui dit croyances, dit distribution de probabilités, et donc complications supplémentaires au niveau du traitement mathématique. Ces croyances peuvent être plus ou moins élaborées et donc donner lieu à des développements d’une grande complexité. Toutefois, elles ne sont généralement que le produit de l’imagination du théoricien (dont l’imagination est souvent sans limites !), et non le fruit d’une observation quelconque (les expériences menées, avec ces jeux fictifs, montrent des comportements fort éloignés de ce que suppose la théorie).
Normes, conventions et autres " rationalité limitée "
Tout cela est parfaitement connu des " vrais " théoriciens des jeux - ceux qui maîtrisent effectivement les modèles, sans se contenter de parler d’ " outils " et " solutions ", tout en restant dans le vague. Pour essayer de sortir du piège - notamment le fait que la théorie ne fait pas de prédictions, sauf cas exceptionnel -, il faut rajouter " autre chose " dans les modèles, un deus ex machina. Parmi il y a le " point focal " de Schelling : les individus se " coordonneraient " spontanément, du fait de référence communes (d’ordre culturelle, ou autre). Par exemple, des personnes s’étant donné rendez-vous dans un aéroport, sans autre précision, iraient devant le panneau d’affichage des départs, ou à la cafétéria, ou ... Ou alors, oh paradoxe !, on introduit une certaine dose d’incertitude ou d’ " irrationalité " (ou de croyance en l’irrationalité) dans le modèle. C’est ainsi qu’on essaye de " résoudre " le " dilemme " des prisonniers, surtout lorsqu’il est répété un certain nombre de fois ; mais alors, la " solution " (floue) proposée n’est pas un équilibre de Nash, le but étant d’essayer d’expliquer les comportements effectivement observés, lors d’expériences avec des joueurs en chair et en os (qui ne se comportement pratiquement jamais comme la théorie le prédit). La leçon de l’histoire : un peu - ou beaucoup - d’incertitude ou d’irrationalité peut être une bonne chose pour tout le monde ! Voilà de quoi faire douter de la pertinence des modèles de la microéconomie habituelle, et du discours sur les bienfaits des interactions des comportements rationnels (égoïstes), via la " main invisible " !
De façon plus générale, il est devenu usuel chez les théoriciens des jeux les plus réputés (par exemple; Aumann, Kreps, Rubinstein) d’affirmer que la seule issue pour la théorie des jeux, si elle veut quelque peu rendre compte de ce qu’on observe dans le monde économique, est de faire appel à la " rationalité limitée ", notion d’abord proposée par Herbert Simon (qui, depuis longtemps, nie toute pertinence et intérêt à la théorie des jeux), et dont la définition est d’ailleurs passablement floue. N’est-ce pas là avouer clairement que la théorie des jeux, dont le point de départ était le postulat de rationalité des individus, ne sert à rien, si ce n’est à montrer le peu de pertinence des analyses qui veulent expliquer les phénomènes économiques et sociaux en se basant sur ce seul postulat ?
A quoi sert la théorie des jeux ? D’abord et avant tout, à permettre de publier articles et livres. Ensuite, à dire : les relations sociales sont d’une très grande complexité, et peuvent mener à n’importe quoi, en théorie. Avait-on besoin de cette " théorie " pour arriver à une telle conclusion ? Ici encore, la réponse est évidente ... Mais soyons sûrs que beaucoup de gens continueront à écrire " la théorie des jeux fait ci, fait ça ", " la théorie des jeux permet de résoudre tel ou tel problème ", " maintenant, nous disposons des ‘avancées ’ de la théorie des jeux ". On attend des preuves, des exemples précis...