Le dilemme du prisonnier caractérise en théorie des jeux une situation particulière, où le comportement rationnel de deux personnes conduit à un résultat globalement pire.
Situation initiale
Deux personnes sont accusées d’avoir commis un crime et arrêtées par la police. Cependant, celle-ci ne peut prouver que des infractions mineures à la loi sur les armes, et pas le braquage qu’elles ont commis ensemble. La police interroge les deux personnes séparément et leur fait l’offre suivante :
Si l’un des prisonniers avoue, il n’ira pas en prison, mais son complice devra y passer 5 ans. S’ils avouent tous les deux, ils passeront 4 ans chacun en prison. Si aucun des deux n’avoue, la police ne peut prouver que l’infraction à la loi sur les armes, pour laquelle ils devront passer 1 an chacun en prison.
La situation de ces deux personnes, A et B, se présente donc ainsi :
La meilleure solution serait que les deux se taisent, ils ne seraient alors soumis qu’à la peine d’ensemble la plus légère (2 ans combinés).
La situation individuelle de A (comme celle de B) se présente maintenant ainsi :
● Si A suppose que B va se taire, il est plus avantageux pour lui de le trahir, car il évitera alors une peine
● Si A suppose que B va le trahir, alors, de nouveau, il vaut mieux qu’il le trahisse.
Leur dilemme se présente alors ainsi :
Quelle que soit l’action de l’autre, le trahir est toujours le choix le plus rationnel, car on s’en tire mieux que lui (4 au lieu de 5 ans de prison ou 0 au lieu de 2 ans). Cependant, s’ils se trahissent mutuellement, ils devront passer 4 ans chacun en prison, ce qui est la pire de toutes les possibilités.
Le jeu part du principe que les deux personnes ne peuvent pas négocier. Une situation similaire au dilemme du prisonnier peut souvent émerger dans le cadre d’une économie (p. ex. au seins de cartels, d’oligopoles, etc.)
Stratégies
Lorsqu’on répète le jeu du dilemme du prisonnier sur plusieurs tours (à de nombreuses reprises), il existe différentes stratégies pour en maximiser l’issue :
● Œil pour œil : au premier tour, le joueur coopère. Puis, dès le tour suivant, il reproduit à chaque fois le comportement de l’adversaire lors du coup précédent. Cette stratégie est donc basée sur une attitude coopérative, mais sanctionne immédiatement la trahison. Dans le contexte de simulations informatiques, c’est celle qui est considérée comme la plus efficace.
● Spite (Groll) : le joueur coopère jusqu’à ce que l’autre triche pour la première fois. Dès lors, il triche à chaque fois. La coopération dure jusqu’au premier abus de confiance. C’est une stratégie très vindicative.
● Pavlov : le joueur coopère au premier tour, puis triche à chaque fois que le coup précédent de l’autre joueur est différent du sien. La coopération a lieu lorsque les deux joueurs coopèrent au tour précédent et inversement. Cela entraîne un changement de comportement si le bénéfice lors du tour précédent était faible, mais au même comportement si le bénéfice était important.
Il existe des dizaines d’autres stratégies. Cependant, elles n’ont de sens que si les joueurs ne connaissent pas le nombre de tours qui seront joués. Sans quoi, les joueurs se trahiront mutuellement lors du dernier coup, car il n’y aura plus de répercussion possible. De même, à l’avant-dernier coup, comme les deux joueurs savent qu’ils seront trahis au tour suivant, ils auront intérêt à se trahir. Par conséquent, si l’on poursuit ce raisonnement, les joueurs ne coopéreront donc à aucun coup.
G2 serait nécessaire, mais: Au moment, juridiquement, une obligation pour toute la population de se faire vacciner est exclue. La…