Wikipedia

Résultats de recherche

Traduction

Un sacré dilemme pour la "Morale" !

Penchons-nous sur un jeu de la Théorie des jeux, discipline des mathématiques et de l'économie qui étudie les situations stratégiques et les interactions entre agents rationnels, permettant d'examiner les tensions entre coopération et trahison chez des agents rationnels : le dilemme du prisonnier

Il met en scène deux détenus soupçonnés d’un vol et emprisonnés dans des cellules séparées. Ne disposant pas de preuve, la police fait à chacun des deux le marché suivant :

"Tu as le choix entre dénoncer ton complice ou non. Si tu le dénonces et qu'il te dénonce aussi, vous aurez une remise de peine d'un an tous les deux. Si tu le dénonces et que ton complice te couvre, tu auras une remise de peine de 5 ans, mais ton complice tirera le maximum. Mais si vous vous couvrez mutuellement, vous aurez tous les deux une remise de peine de 3 ans."

N.B : Les récompenses et pénalités associées aux différentes combinaisons de stratégies peuvent varier selon les sources. Ces valeurs numériques ne représentent qu'un scénario hypothétique utilisé pour expliquer les principes fondamentaux de la théorie des jeux. L'essence du dilemme du prisonnier réside dans les incitations contradictoires des protagonistes.

Dans cette situation, il est considéré que si les deux s'entendent, ils s'en tireront globalement mieux que si l'un des deux dénonce l'autre. Mais justement, l'un des deux peut être tenté de s'en tirer encore mieux en dénonçant son complice, ce qui permet un meilleur gain dans cette configuration. Craignant cela, l'autre risque aussi de dénoncer son complice pour ne pas être le dindon de la farce. Le dilemme est donc : faut-il accepter de couvrir son complice (donc coopérer avec lui) ou le trahir ? 
Lorsque ce jeu n’est joué qu’une seule fois, le plus rentable est de trahir. Ce sont par exemple certains restaurants pour touristes, chers et mauvais, dont la préoccupation n’est pas tant de fidéliser une clientèle que de profiter au maximum de la manne des touristes qui ne font que passer. Mais tout change si le jeu comporte plusieurs sessions (= dilemme du prisonnier répété ou itéré) ; car chacun a vu comment le complice s’est comporté aux tours précédents, ce qui peut faire changer de stratégie pour un meilleur « rendement ». Pour reprendre l’exemple, on ne retourne pas dans un restaurant qui a « trahi » sur la qualité et/ou le prix !

Un concours international a confronté différentes stratégies dans le cadre de ce jeu. Résultat des courses : c’est la stratégie « Donnant donnant » (« œil pour œil » ou « Tit for Tat » en anglais) qui est l’une des plus efficaces dans le cadre du dilemme du prisonnier répété[1]. Elle consiste à coopérer au premier coup puis à systématiquement copier le comportement de son complice à la session précédente. Une variante, « œil pour œil avec pardon », s'est révélée un peu plus efficace encore : en cas de trahison de l'adversaire, on coopère parfois (de 1 à 5 %) au coup suivant. Cela permet d'éviter de rester bloqué dans un cycle négatif. Le meilleur réglage dépend des autres participants. En particulier, « œil pour œil avec pardon » est plus efficace si la communication est brouillée, c'est-à-dire s'il arrive qu'un autre participant interprète à tort un coup. Dans ce cas, je commence par coopérer, et si je suis trahi, je coopère à nouveau, mais une seule fois. Notons qu’Il est possible de jouer à ce jeu sur certains serveurs internet.[2]

Les recherches et publications concernant ce jeu sont florissantes du fait de nombreuses stratégies et variantes possibles. La conclusion la plus simple de ce jeu est que les stratégies de coopération l’emportent en termes de gains personnels sur les stratégies de trahison.

Pour le docteur en psychologie et en philosophie Tal Ben-Shahar :

« Celui qui contribue au bien-être d’autrui en tire tant de bénéfice personnel que, à mes yeux, il n’y a pas plus égoïste qu’un geste généreux. Non seulement l’humeur est améliorée, mais aussi l’image de soi : les circuits de la récompense reçoivent une activation des plus plaisantes. Somme toute, on se fait du bien aussi à soi - bénéfice secondaire non négligeable - quand on fait du bien aux autres ».[3]

Quelles sont les « bonnes » stratégies ? Selon les chercheurs en informatique Jean-Paul Delahaye et Philippe Mathieu :

« Les bonnes stratégies sont les stratégies réactives qui répondent quand on les trahit, qui prennent le risque de coopérer (elles commencent par coopérer et face à un adversaire qui coopère, elles ne tentent pas de trahir), et savent être indulgentes (après une trahison de l’adversaire elles finissent par pardonner pour renouer la coopération). Les résultats obtenus par des calculs qui modélisent la sélection naturelle à travers ce jeu conduisent à une conclusion surprenante : bien qu’il n’y ait pas d’autorité de contrôle et que la tentation de la trahison soit présente à chaque coup joué, l’évolution favorise les stratégies qui ne prennent jamais l’initiative de trahir (...) À partir d’une définition élémentaire, le dilemme du prisonnier crée un problème d’une étonnante difficulté dont nous ne réussissons à comprendre les règles que progressivement, ce qui illustre encore une fois que du simple peuvent naître des comportements et des dynamiques d’une richesse sans limite[4]

Autrement dit, dans le cadre d’interactions répétées (famille / voisins / étrangers / collègues etc.), d’un point de vue strictement « comptable » et dans mon propre intérêt « égoïste », je devrais toujours coopérer d’emblée, puis ajuster la relation, c’est-à-dire la stratégie, en fonction de la réponse de l’autre. 

L’altruisme est un égoïsme intelligent

Mais comme tout le monde n’a pas bien compris son propre intérêt à moyen / long terme, il faut s’accommoder bon gré mal gré des nombreuses petites trahisons du quotidien, mensonges et autre mauvaise foi : photos « grand angle » des agences immobilières afin de magnifier la maison à vendre, miroir amincissant des boutiques de prêt à porter (« cette robe vous amincit tellement ! »), sans compter les très nombreux produits en vente à X,99 euros : ce prix ne peut pas être le « vrai » prix, évidemment... Et en plus on vous prend pour une buse qui n’aurait pas vu l’arnaque ! 

On peut allonger la liste avec l’homéopathie, les poudres de perlimpinpin pour soigner l’arthrose, la fatigue, la cellulite, les rides profondes etc., le tout sans aucune preuve d’efficacité réelle en dehors d’un effet placebo plus ou moins « optimisé » par la blouse blanche du médecin ou du pharmacien. En revanche, le prix à payer n’est pas une illusion.

Plus largement, on peut constater que les grandes religions - des sectes qui ont "réussi" - prônent globalement la coopération, l'amour du prochain, reprenant en quelque sorte les résultats du dilemme du prisonnier sans le savoir. Il faut dire que les sectes qui choisissent la trahison comme concept (Thugs en Inde, la Famille Manson, l'Ordre du Temple Solaire, la secte Aum Shinrikyo...) ne font pas de vieux os ; soit une sélection naturelle qui s'applique également à la culture. Ceux qui ne coopèrent pas (au sens large) disparaîtront

Et ce ne sont pas les religions qui sont à l'origine de la morale qui - certes de façon plus primitive que la nôtre - a réglé les interactions entre individus bien avant les premières "grandes" religions. Il suffit pour s'en convaincre d'étudier les interactions animales dans un groupe quelconque : les "règles" de vie en bonne société sont partout présentes, sans religion ni Libre Arbitre... (voir La science peut-elle aider à comprendre - voire infléchir -la moralité humaine ?).

Qui plus est, les "textes sacrés" sont évidemment datés et en conflit ouvert avec notre morale qui a évolué comme il en est question dans cette vidéo aussi amusante qu'effrayante... à la "foi".


[1] Deux autres stratégies ont été identifiées comme tout aussi intéressantes : Pavlov et Gradual :

1) Pavlov : lors du premier coup, je coopère ; ensuite si au dernier coup joué, j’ai gagné 3 points ou plus je rejoue la même chose, sinon je change.

2) Gradual : je coopère au premier coup; ensuite, lorsque mon adversaire me trahit, je le punis le coup suivant (comme dans la stratégie « donnant-donnant »), mais je suis plus sévère car je punis mon adversaire en jouant la trahison pendant X coups consécutifs, où X est le nombre de trahisons passées de mon adversaire (mes punitions sont donc graduelles). Après une telle phase de rétorsion, je coopère deux fois de suite pour tenter de rétablir la paix.

[3] « Apprendre à être heureux - Semaine 19 » - Tal Ben-Shahar

[4] « Le dilemme du prisonnier et l’illusion de l’extorsion » - Jean-Paul Delahaye, Philippe Mathieu -https://www.pourlascience.fr/sr/logique-calcul/le-dilemme-du-prisonnier-et-l-illusion-de-l-extorsion-7694.php____________________________________________

« Le dilemme du prisonnier | Voyages au pays des maths » - VIDEO ARTE Youtube  

Cliquer sur le carré en bas à droite de l'écran vidéo pour la voir en plein écran