Two perfectly rational gingerbread men, Crispy and Chewy, are out strolling when they’re caught by a fox. Seeing how happy they are, he decides that, instead of simply eating them, he’ll put their friendship to the test with a cruel dilemma. He’ll ask each gingerbread man whether he’d opt to Spare or Sacrifice the other. They can discuss, but neither will know what the other chose until their decisions are locked in.
To helt rasjonelle pepper- kakemenn: Sprø og Seig er ute og går tur, når de blir fanget av en rev. Når han ser hvor lykkelige de er, bestemmer han seg for, at i stedet for å spise dem, vil han sette vennskapet deres på prøve med et grusomt dilemma. Han vil spørre hver pepperkakemann om han vil redde eller ofre den andre. De kan diskutere, men ingen av dem får vite hva den andre velger før valgene er låst.
If both choose to spare the other, the fox will eat just one of each of their limbs; if one chooses to spare while the other sacrifices, the sparer will be fully eaten, while the traitor will run away with all his limbs intact. Finally, if both choose to sacrifice, the fox will eat 3 limbs from each.
Hvis begge velger å redde den andre, kommer reven bare til å spise et lem av hver av dem; hvis én av dem vil redde mens den andre vil ofre, vil den som valgte å redde, bli spist opp mens forræderen slipper unna med alle sine lemmer i behold. Til slutt, hvis begge vil ofre, så spiser reven tre lemmer av hver mann.
In game theory, this scenario is called the “Prisoner's Dilemma.” To figure out how these gingerbread men will act in their perfect rationality, we can map the outcomes of each decision. The rows represent Crispy’s choices, and the columns are Chewy’s. Meanwhile, the numbers in each cell represent the outcomes of their decisions, as measured in the number of limbs each would keep:
I spillteori kalles dette scenariet: "Fangens dilemma." For å finne ut hvordan disse rasjonelle pepperkakemennene kommer til å handle, kan vi kartlegge utfallet av hver avgjørelse. Radene representerer Sprø sine valg, kolonnene er Seig sine. Verdiene i hver celle representerer utfallet av avgjørelsene, målt i antall lemmer hver av dem kommer til å beholde:
So do we expect their friendship to last the game?
Vil vennskapet vare?
First, let’s consider Chewy’s options. If Crispy spares him, Chewy can run away scot-free by sacrificing Crispy. But if Crispy sacrifices him, Chewy can keep one of his limbs if he also sacrifices Crispy. No matter what Crispy decides, Chewy always experiences the best outcome by choosing to sacrifice his companion. The same is true for Crispy.
La oss se på Seig sine muligheter: Hvis Sprø redder ham, kan Seig slippe unna uten en skramme ved å ofre Sprø. Men hvis Sprø ofrer ham, kan Seig beholde en av lemmene sine hvis han også ofrer Sprø. Uansett hva Sprø bestemmer seg for, så kan Seig alltid få best mulig resultat ved å velge å ofre kameraten sin. Det samme gjelder for Sprø.
This is the standard conclusion of the Prisoner's Dilemma: the two characters will betray one another. Their strategy to unconditionally sacrifice their companion is what game theorists call the “Nash Equilibrium," meaning that neither can gain by deviating from it.
Dette er den vanlige konklusjonen på Fangens dilemma: Deltakerne vil svike hverandre. Strategien med å ofre kameraten uten betingelser er det spillteoretikere kaller "Nash-likevekt". I det ligger at ingen av dem tjener på å avvike fra den.
Crispy and Chewy act accordingly and the smug fox runs off with a belly full of gingerbread, leaving the two former friends with just one leg to stand on.
Sprø og Seig handler deretter og den selvtilfredse reven løper av sted med magen full av pepperkake mens de to tidligere vennene står igjen med bare ett bein å stå på.
Normally, this is where the story would end, but a wizard happened to be watching the whole mess unfold. He tells Crispy and Chewy that, as punishment for betraying each other, they’re doomed to repeat this dilemma for the rest of their lives, starting with all four limbs at each sunrise. Now what happens?
Vanligvis slutter historien her, men det hadde seg slik at en trollmann iakttok hele dette rotet som foregikk. Han sier til Sprø og Seig at som straff for at de bedro hverandre, er de dømt til å gjenta dette dilemmaet resten av livet - hver gang solen står opp, starter de med alle fire lemmer. Hva vil skje da?
This is called an Infinite Prisoner’s Dilemma, and it’s a literal game changer. That’s because the gingerbread men can now use their future decisions as bargaining chips for the present ones. Consider this strategy: both agree to spare each other every day. If one ever chooses to sacrifice, the other will retaliate by choosing “sacrifice” for the rest of eternity. So is that enough to get these poor sentient baked goods to agree to cooperate?
Dette kalles et Uendelig Fangens dilemma og endrer spillereglene, bokstavelig talt. Nå kan pepperkakemennene bruke framtidige avgjørelser som forhandlingskort for avgjørelsene som tas nå. Strategien kan være: Begge er enige om å redde hverandre hver dag. Hvis en av dem noen gang velger å ofre den andre, vil den andre hevne seg ved å velge å ofre i all framtid. Vil dette være nok for å få disse selvbevisste kakene til å samarbeide?
To figure that out, we have to factor in another consideration: the gingerbread men probably care about the future less than they care about the present. In other words, they might discount how much they care about their future limbs by some number, which we’ll call delta. This is similar to the idea of inflation eroding the value of money. If delta is one half, on day one they care about day 2 limbs half as much as day 1 limbs, day 3 limbs 1 quarter as much as day 1 limbs, and so on.
For å finne ut det må vi også ta dette med i betraktningene våre: Pepperkakemennene bryr seg sannsynligvis mindre om framtiden enn om det som skjer nå. De kan med andre ord feilberegne hvor mye de bryr seg om sine framtidige lemmer, med en gitt verdi, la oss kalle den delta. Dette minner om inflasjon – som gjør at penger mister verdien sin. Hvis delta er en halvdel, bryr de seg halvparten så mye om lemmene på dag to, som de gjør på dag en, En fjerdedel så mye på dag tre som på dag en, og så videre.
A delta of 0 means that they don’t care about their future limbs at all, so they’ll repeat their initial choice of mutual sacrifice endlessly. But as delta approaches 1, they’ll do anything possible to avoid the pain of infinite triple limb consumption, which means they’ll choose to spare each other. At some point in between they could go either way. We can find out where that point is by writing the infinite series that represents each strategy, setting them equal to each other, and solving for delta.
Hvis delta er null, bryr de seg ikke om sine framtidige lemmer i det hele tatt – da vil de gjenta valget med gjensidig ofring i det uendelige. Etter hvert som delta blir nærmere en, kommer de til gjøre alt i sin makt for å unngå smerten ved å få tre lemmer spist opp – noe som gjør at de velger å redde hverandre. På et punkt midt i mellom kan det vippe begge veier. Vi kan finne ut hvor dette punktet er ved å skrive opp den uendelige rekken som representerer hver strategi, sette dem lik hverandre, og løse med hensyn på delta.
That yields 1/3, meaning that as long as Crispy and Chewy care about tomorrow at least 1/3 as much as today, it’s optimal for them to spare and cooperate forever.
Da får vi en tredjedel, som betyr at så lenge Sprø og Seig bryr seg om morgendagen, minst en tredjedel så mye som dagen i dag, så er det optimalt for dem å redde hverandre og alltid samarbeide.
This analysis isn’t unique to cookies and wizards; we see it play out in real-life situations like trade negotiations and international politics. Rational leaders must assume that the decisions they make today will impact those of their adversaries tomorrow. Selfishness may win out in the short-term, but with the proper incentives, peaceful cooperation is not only possible, but demonstrably and mathematically ideal.
Analysen er ikke enestående for kaker og trollmenn; vi ser den i virkelige situasjoner som i forhandlinger om handel og i internasjonal politikk. Rasjonelle ledere må anta at de avgjørelsene de tar i dag – vil påvirke motstandernes avgjørelser i morgen. Å være egoistisk vil være lønnsomt på kort sikt, men med riktige incentiver er ikke fredelig samarbeid bare mulig, men påviselig og matematisk ideelt.
As for the gingerbread men, their eternity may be pretty crumby, but so long as they go out on a limb, their friendship will never again be half-baked.
Når det gjelder pepperkakemennene, kan det bli evig oppsmuldring, men så lenge de har ett bein plantet på jorda, vil vennskapet deres alltid tåle steken.