Remerciez-le!

Remerciez @Admin pour avoir partagé cet document gratuitement, de la manière la plus simple, en partageant sur les réseaux sociaux.

Dilemme du prisonnier Le dilemme du prisonnier est un exemple célèbre de la thé

Dilemme du prisonnier Le dilemme du prisonnier est un exemple célèbre de la théorie des jeux. Dans ce jeu, comme dans bien d'autres, il est fait l'hypothèse que chaque joueur ici appelé " prisonnier " essaye de maximiser ses bénéfices sans tenter d'en faire autant avec ceux de l'autre joueur. Principe La forme habituelle de ce dilemme est celle de deux prisonniers retenus dans des cellules séparées et qui ne peuvent communiquer.  si un seul des deux avoue, celui-ci est certain d'obtenir une remise de peine alors que le second obtient la peine maximale (10 ans) ;  si les deux avouent, ils seront condamnés à une peine plus légère (5 ans) ;  si aucun n'avoue, la peine sera minimale (6 mois), faute d'éléments au dossier. Ce problème modélise bien les questions de politique tarifaire : le concurrent qui baisse ses prix gagne des parts de marché et peut ainsi augmenter ses ventes et accroître éventuellement son bénéfice... mais si son concurrent principal en fait autant, les deux peuvent y perdre. L'équilibre de Nash pour ce type de jeu ne conduit pas à un optimum de Pareto (c'est-à-dire un état dans lequel on ne peut pas améliorer le bien-être d’un individu sans détériorer celui d’un autre). À l'équilibre, chacun des prisonniers choisit de faire défaut même s'ils gagnaient à coopérer. Malheureusement pour les prisonniers, chacun est incité à tricher après avoir fait la promesse de coopérer. C'est le cœur du dilemme. Ceci est cependant sensiblement différent d'une situation de marché libre ou les deux agents économiques "prisonniers" peuvent coopérer pour atteindre un optimum de Pareto (parce que l'optimum vu par les producteurs ne va pas toujours dans l'intérêt du consommateur, les lois antitrust de tous les pays interdisent, officiellement du moins, les ententes entre producteurs concurrents). Dans un jeu du dilemme du prisonnier répété, chaque joueur a l'opportunité de " punir " l'autre joueur pour sa précédente non-coopération. La coopération peut donc survenir dans cette configuration. L'incitation à tricher est inférieure à la menace de punition, ce qui introduit la possibilité de coopérer. Le dilemme du prisonnier est utilisé par les économistes, les mathématiciens, les psychologues, les biologistes et les spécialistes de science politique. Le paradigme correspondant est également mentionné en philosophie et dans le domaine des sciences cognitives. Dilemme du prisonnier classique Formulation La première expérience du dilemme du prisonnier a été réalisée en 1950 par Melvin Dresher et Merill Flood, qui travaillaient alors pour la RAND Corporation. Par la suite, Albert W. Tucker la présenta sous la forme d'une histoire: Deux suspects sont arrêtés par la police. Mais les agents n'ont pas assez de preuves pour les inculper, donc ils les interrogent séparément en leur faisant la même offre. " Si tu dénonces ton complice et qu'il ne te dénonce pas, tu seras remis en liberté et l'autre écopera de 10 ans de prison. Si tu le dénonces et lui aussi, vous écoperez tous les deux de 5 ans de prison. Si personne ne se dénonce, vous aurez tous deux 6 mois de prison. " On résume souvent les utilités de chacun dans ce tableau: 1 \ 2 Se tait Dénonce Se tait (-1/2;-1/2) (-10;0) Dénonce (0;-10) (-5;-5) Chacun des prisonniers réfléchit de son côté en considérant les deux cas possibles de réaction de son complice.  " Dans le cas où il me dénoncerait : o Si je me tais, je ferai 10 ans de prison ; o Mais si je le dénonce, je ne ferai que 5 ans. "  " Dans le cas où il ne me dénoncerait pas : o Si je me tais, je ferai 6 mois de prison ; o Mais si je le dénonce, je serai libre. " " Quel que soit son choix, j'ai donc intérêt à le dénoncer. " Si chacun des complices fait ce raisonnement, les deux vont probablement choisir de se dénoncer mutuellement, ce choix étant le plus empreint de rationalité. Conformément à l'énoncé, ils écoperont dès lors de 5 ans de prison chacun. Or, s'ils étaient tous deux restés silencieux, ils n'auraient écopé que de 6 mois chacun. Ainsi, lorsque chacun poursuit son intérêt individuel, le résultat obtenu n'est pas optimal au sens de Vilfredo Pareto. Ce jeu est à somme non nulle, c'est-à-dire que la somme des gains pour les participants n'est pas toujours la même : il soulève une question de coopération. Pour qu'il y ait dilemme, la tentation T (je le dénonce, il se tait) doit payer plus que la coopération R (on se tait tous les deux) , qui doit rapporter plus que la punition pour égoïsme P (je le dénonce, il me dénonce), qui doit être plus valorisante que la duperie S (je me tais, il me dénonce). Ceci est formalisé par : T > R > P > S (ici : 0 > -0,5 > -5 > -10) Pour qu'une collaboration puisse naître dans un dilemme répété (ou itératif) (voir plus bas), 2 coups de coopération R doit être plus valorisant que l'alternat Tentation / Dupe. Ce qui fait la condition 2R > T+S [ici : 2*-0,5 > 0 + (-10)]. Exemples d'application Le dilemme du prisonnier fournit un cadre général pour penser les situations où deux ou plusieurs acteurs ont un intérêt à coopérer, mais un intérêt encore plus fort à ne pas le faire si l'autre le fait, et aucun moyen de contraindre l'autre. Certains domaines comme l'écologie ou l'économie utilisent intégralement la nature mathématique du problème en donnant un sens concret aux paramètres, par exemple celui de paiements. D'autres ne retiennent que le cadre conceptuel pour catégoriser des situations où les paiements sont peu quantifiables. Les exemples suivants permettront de mieux cerner la diversité des applications possibles et la grande généralité du cadre du dilemme du prisonnier. Économie Un exemple canonique est le cas de deux entreprises qui n'ont pas le droit de s'entendre sur une politique commerciale commune (ce que la loi antitrust états-unienne interdit) et qui se demandent s'il leur faut procéder ou non à une baisse de prix pour conquérir des parts de marché aux dépens de leur concurrent. Il va de soi que si tous deux baissent leur prix, ils seront tous deux perdants par rapport au statu quo, sauf bien sûr si le marché présente l'élasticité exceptionnelle pouvant caractériser le secteur informatique, par exemple. Le dilemme du prisonnier est donné, à tort, comme exemple que la concurrence conduit à des situations socialement déplorables. En effet, si l'on fait intervenir un troisième joueur (la société), il est possible d'imaginer qu'elle préfère l'absence de coopération des criminels entre eux, ou l'absence de collusion entre les entreprises. Surtout, les baisses de prix résultant de la concurrence, que la théorie des jeux aborde avec réalisme, profite à l'ensemble des consommateurs en leur permettant d'obtenir la même satisfaction à moindre prix, et donc d'utiliser la différence pour consommer ailleurs, et favoriser le dynamisme général. Le bien-être général a augmenté même si du point de vue subjectif et incomplet du seul producteur, on eut pu croire que la concurrence amenait à une baisse de la satisfaction des acteurs concernés. En d'autres termes, le résultat du jeu peut être jugé comme socialement préférable. En fait, la structure du dilemme du prisonnier isole un mode d'interaction entre joueurs, permet d'en tirer des conséquences directes pour eux sans préjudice d'autres conséquences à préciser au cas par cas. Écologie La théorie des jeux, et le dilemme du prisonnier en particulier, sont fréquemment utilisés en écologie pour modéliser l'évolution des comportements entre individus d'une même espèce vers des stratégies évolutivement stables. L'apparition et le maintien des comportements de coopération par exemple, se prêtent à ce type d'analyse. Richard Dawkins en a fait l'un des points centraux de sa théorie du gène égoïste, puisque l'optimisation de la survie peut passer par un comportement apparemment altruiste. Politique internationale Soit deux pays A et B. Les pays A et B peuvent choisir de maintenir ou non une armée. Si tous deux ont une armée, la guerre est impossible, car trop coûteuse. Les dépenses militaires sont alors une perte nette pour les deux pays. Si un seul a une armée, il peut évidemment conquérir sans coup férir l'autre, ce qui est pire. Enfin, si aucun n'a d'armée, la paix règne et les pays n'ont pas de dépenses militaires. La situation de coopération permettant à chacun de ne pas avoir d'armée est évidemment préférable à la situation où les deux pays entretiennent une armée, mais elle est instable : chacun des deux pays a une forte incitation à se doter unilatéralement d'une armée pour envahir l'autre. Sociologie et anthropologie Les sciences humaines ont également adopté le cadre conceptuel du dilemme du prisonnier pour parler de situations bloquées dans un état défavorable par la difficulté à coordonner les actions des différents agents ou à vérifier (et éventuellement punir) les déviances égoïstes. Ce cadre a ainsi été utilisé par les sociologues pour expliquer la lenteur de l'adoption des semences à haut rendement dans le monde agricole français dans uploads/S4/dilemme-du-prisonnier.pdf