Two perfectly rational gingerbread men, Crispy and Chewy, are out strolling when they’re caught by a fox. Seeing how happy they are, he decides that, instead of simply eating them, he’ll put their friendship to the test with a cruel dilemma. He’ll ask each gingerbread man whether he’d opt to Spare or Sacrifice the other. They can discuss, but neither will know what the other chose until their decisions are locked in.
Deux hommes en pain d'épices, parfaitement rationnels, Croquant et Tendre, sont surpris par un renard alors qu'ils se promènent. Les voyant heureux ensemble, le renard décide qu'il ne va pas simplement les manger. Il va mettre leur amitié à l'épreuve dans un dilemme cruel. Il va demander à chaque homme s'il choisit de sauver ou de sacrifier son ami. Ils peuvent discuter ensemble mais aucun ne sait quel sera le choix de l'autre avant qu'il ne le détermine.
If both choose to spare the other, the fox will eat just one of each of their limbs; if one chooses to spare while the other sacrifices, the sparer will be fully eaten, while the traitor will run away with all his limbs intact. Finally, if both choose to sacrifice, the fox will eat 3 limbs from each.
Si les deux amis choisissent de sauver l'autre, le renard mangera une jambe de chaque ami. Si un choisit de sauver l'autre mais que l'autre choisit de sacrifier son ami, celui qui a sauvé son ami sera dévoré par le renard alors que le traitre pourra s'enfuir sain et sauf. Enfin, si les deux choisissent de sacrifier l'autre, le renard mangera trois membres de chaque ami.
In game theory, this scenario is called the “Prisoner's Dilemma.” To figure out how these gingerbread men will act in their perfect rationality, we can map the outcomes of each decision. The rows represent Crispy’s choices, and the columns are Chewy’s. Meanwhile, the numbers in each cell represent the outcomes of their decisions, as measured in the number of limbs each would keep:
Dans la théorie des jeux, ce scénario est appelé le dilemme du prisonnier. Pour déterminer comment chaque homme en pain d'épices agira rationnellement, nous allons cartographier le résultat de chaque décision. Sur les lignes, on a les choix de Croquant et dans les colonnes, ceux de Tendre. Le chiffre dans chaque cellule représente le résultat de leurs décisions, mesuré selon le nombre de membres qu'ils vont garder intacts.
So do we expect their friendship to last the game?
Leur amitié survivra-t-elle à ce dilemme ?
First, let’s consider Chewy’s options. If Crispy spares him, Chewy can run away scot-free by sacrificing Crispy. But if Crispy sacrifices him, Chewy can keep one of his limbs if he also sacrifices Crispy. No matter what Crispy decides, Chewy always experiences the best outcome by choosing to sacrifice his companion. The same is true for Crispy.
Observons d'abord les choix de Tendre. Si Croquant le sauve, Tendre peut s'enfuir sain et sauf en sacrifiant son ami. Mais si Croquant le sacrifie, Tendre peut conserver un membre si lui aussi sacrifie Croquant. Quel que soit le choix de Croquant, Tendre obtient toujours un meilleur résultat en sacrifiant son ami. Tout cela est vrai aussi pour Croquant.
This is the standard conclusion of the Prisoner's Dilemma: the two characters will betray one another. Their strategy to unconditionally sacrifice their companion is what game theorists call the “Nash Equilibrium," meaning that neither can gain by deviating from it.
C'est la conclusion typique du dilemme du prisonnier : les deux personnages se trahiront mutuellement. Leur stratégie de sacrifier inconditionnellement leur ami est ce que les experts en théorie des jeux appelle l'équilibre de Nash, un équilibre où aucun ne peut faire mieux en s'en écartant.
Crispy and Chewy act accordingly and the smug fox runs off with a belly full of gingerbread, leaving the two former friends with just one leg to stand on.
Croquant et Tendre agissent en conséquence et l'arrogant renard repart le ventre repu de pain d'épices, laissant aux deux anciens amis une seule jambe chacun.
Normally, this is where the story would end, but a wizard happened to be watching the whole mess unfold. He tells Crispy and Chewy that, as punishment for betraying each other, they’re doomed to repeat this dilemma for the rest of their lives, starting with all four limbs at each sunrise. Now what happens?
L'histoire aurait dû se terminer ici mais un mage observait par hasard le drame se dérouler. Il dit alors à Croquant et Tendre qu'en punition pour leur trahison, ils seront condamnés à répéter ce dilemme le reste de leur vie, et que chaque matin, ils se réveilleront avec quatre membres intacts. Que va-t-il se passer alors ?
This is called an Infinite Prisoner’s Dilemma, and it’s a literal game changer. That’s because the gingerbread men can now use their future decisions as bargaining chips for the present ones. Consider this strategy: both agree to spare each other every day. If one ever chooses to sacrifice, the other will retaliate by choosing “sacrifice” for the rest of eternity. So is that enough to get these poor sentient baked goods to agree to cooperate?
On appelle cela un jeu infini du dilemme du prisonnier, et ça change tout. Car en effet, les hommes en pain d'épices peuvent négocier leurs décisions futures contre les choix présents. Imaginez la stratégie où les deux optent de se sauver mutuellement tous les jours. Si un des deux choisit néanmoins de sacrifier son ami, l'autre se vengera en choisissant de sacrifier son ami à chaque fois. Est-ce suffisant pour que ces bonnes pâtes d'hommes acceptent de coopérer ?
To figure that out, we have to factor in another consideration: the gingerbread men probably care about the future less than they care about the present. In other words, they might discount how much they care about their future limbs by some number, which we’ll call delta. This is similar to the idea of inflation eroding the value of money. If delta is one half, on day one they care about day 2 limbs half as much as day 1 limbs, day 3 limbs 1 quarter as much as day 1 limbs, and so on.
Pour savoir cela, nous devons prendre en considération un autre facteur : les hommes en pain d'épices s'inquiètent moins de l'avenir que du présent. Autrement dit, ils pourraient accorder moins de valeur à l'avenir de leurs membres, et cette différence crée un « delta ». C'est semblable à l'inflation qui érode la valeur de l'argent. Si le delta est d'un demi, le jour 1, ils accordent aux membres du jour 2 la moitié de valeur que celle du jour 1. Au jour 3, un quart de valeur par rapport au jour 1, et ainsi de suite.
A delta of 0 means that they don’t care about their future limbs at all, so they’ll repeat their initial choice of mutual sacrifice endlessly. But as delta approaches 1, they’ll do anything possible to avoid the pain of infinite triple limb consumption, which means they’ll choose to spare each other. At some point in between they could go either way. We can find out where that point is by writing the infinite series that represents each strategy, setting them equal to each other, and solving for delta.
Un delta de zéro signifie qu'ils n'accordent aucune importance à l'avenir de leurs membres. Dans ce cas, ils répéteront sans fin leur choix initial de sacrifice mutuel. Mais si le delta est proche de 1, ils feront ce qui est possible pour éviter la douleur de se faire manger trois membres à l'infini et par conséquent, ils choisiront de se sauver mutuellement. À un moment donné, ils pourraient changer d'avis. Nous pouvons déterminer ce moment en écrivant une série infinie qui représente chaque stratégie, les deux amis étant égaux et en résolvant delta.
That yields 1/3, meaning that as long as Crispy and Chewy care about tomorrow at least 1/3 as much as today, it’s optimal for them to spare and cooperate forever.
Ici, on a 1/3, ce qui signifie que tant que Croquant et Tendre accordent de la valeur à demain à hauteur de 1/3 de la valeur d'aujourd'hui, leur solution optimale est de se sauver et de coopérer à l'infini.
This analysis isn’t unique to cookies and wizards; we see it play out in real-life situations like trade negotiations and international politics. Rational leaders must assume that the decisions they make today will impact those of their adversaries tomorrow. Selfishness may win out in the short-term, but with the proper incentives, peaceful cooperation is not only possible, but demonstrably and mathematically ideal.
Cette analyse n'est pas unique aux pain d'épices et aux mages. Cette situation survient dans la vraie vie, comme lors de négociations commerciales ou de politiques internationales. Les dirigeants rationnels doivent supposer que leurs décisions aujourd'hui influenceront celles de leurs adversaires demain. L'égoïsme peut s'avérer être préférable à court-terme, mais avec des incitants appropriés une coopération pacifique est non seulement possible, mais démontrée comme étant mathématiquement idéale.
As for the gingerbread men, their eternity may be pretty crumby, but so long as they go out on a limb, their friendship will never again be half-baked.
L'avenir des hommes en pain d'épices pourrait se retrouver en miette mais tant qu'il ne leur manque qu'une seule jambe, leur amitié ne retombera jamais comme un soufflé.