Two perfectly rational gingerbread men, Crispy and Chewy, are out strolling when they’re caught by a fox. Seeing how happy they are, he decides that, instead of simply eating them, he’ll put their friendship to the test with a cruel dilemma. He’ll ask each gingerbread man whether he’d opt to Spare or Sacrifice the other. They can discuss, but neither will know what the other chose until their decisions are locked in.
Két tökéletesen racionális mézeskalács-emberke, Ropi és Rágcsa, sétálgatnak, amikor elkapja őket egy róka. Látva, milyen boldogok, úgy dönt, ahelyett, hogy egyszerűen megenné őket, próbára teszi a barátságukat egy kegyetlen dilemmával. Megkérdezi mindkét mézeskalács-emberkét, hogy megkíméli vagy feláldozza a másikat. Megbeszélhetik, de egyik sem fogja tudni, mit választ a másik, csak amikor döntésre jutnak.
If both choose to spare the other, the fox will eat just one of each of their limbs; if one chooses to spare while the other sacrifices, the sparer will be fully eaten, while the traitor will run away with all his limbs intact. Finally, if both choose to sacrifice, the fox will eat 3 limbs from each.
Ha mindketten úgy döntenek, hogy megkímélik a másikat, a róka csak egy végtagjukat eszi meg; ha egyikük megkíméli a másikat, miközben az őt feláldozza, akkor a megkímélőt megeszi a róka, miközben az áruló elmenekül, és minden tagja ép marad. Végül, ha mindketten feláldoznák a másikat, a róka megeszi 3 végtagjukat.
In game theory, this scenario is called the “Prisoner's Dilemma.” To figure out how these gingerbread men will act in their perfect rationality, we can map the outcomes of each decision. The rows represent Crispy’s choices, and the columns are Chewy’s. Meanwhile, the numbers in each cell represent the outcomes of their decisions, as measured in the number of limbs each would keep:
A játékelméletben ez a forgatókönyvet „Fogolydilemmának” hívják. Hogy kitaláljuk, hogyan cselekednek a mézeskalács-emberkék racionálisan, feltérképezzük az egyes döntések kimenetelét. A sorok mutatják Ropi döntéseit, az oszlopok pedig Rágcsáét. Az egyes cellákban lévő számok mutatják a döntések eredményeit, számokkal kifejezve, hogy hány végtagjuk marad meg:
So do we expect their friendship to last the game?
Várhatjuk-e tehát, hogy barátságuk túléli a játékot?
First, let’s consider Chewy’s options. If Crispy spares him, Chewy can run away scot-free by sacrificing Crispy. But if Crispy sacrifices him, Chewy can keep one of his limbs if he also sacrifices Crispy. No matter what Crispy decides, Chewy always experiences the best outcome by choosing to sacrifice his companion. The same is true for Crispy.
Először is vegyük fontolóra Rágcsa lehetőségeit. Ha Ropi megkíméli őt, Rágcsa elmenekülhet sértetlenül Ropi feláldozásával. De ha Ropi feláldozza őt, Rágcsa megtarthatja egyik végtagját, ha ő is feláldozza Ropit. Nem számít, hogy dönt Ropi, Rágcsa mindig a legjobb eredménynek véli, ha úgy dönt, hogy feláldozza társát. Ugyanez igaz a Ropira is.
This is the standard conclusion of the Prisoner's Dilemma: the two characters will betray one another. Their strategy to unconditionally sacrifice their companion is what game theorists call the “Nash Equilibrium," meaning that neither can gain by deviating from it.
Vagyis a szokásos következtetés a fogolydilemma esetén: a két személy el fogja árulni egymást. Azt a stratégiát, amelyben feltétel nélkül feláldozzák társukat, a játékelmélettel foglalkozók „Nash-egyensúlynak” hívják, vagyis egyik sem nyerhet ettől eltérve.
Crispy and Chewy act accordingly and the smug fox runs off with a belly full of gingerbread, leaving the two former friends with just one leg to stand on.
Ropi és Rágcsa ennek megfelelően viselkednek és az öntelt róka elszalad mézeskaláccsal teli hassal, otthagyva a két volt barátot egy lábon állva.
Normally, this is where the story would end, but a wizard happened to be watching the whole mess unfold. He tells Crispy and Chewy that, as punishment for betraying each other, they’re doomed to repeat this dilemma for the rest of their lives, starting with all four limbs at each sunrise. Now what happens?
Normális esetben itt ér véget a történet, de egy varázsló történetesen felfigyelt a kibontakozó zűrös helyzetre. Azt mondja Ropinak és Rágcsának, mivel elárulták egymást, büntetéseként arra ítéltettek, hogy életük végéig ez a helyzet ismétlődjön minden nap, négy végtaggal kezdve minden napkeltekor. Mi történik most?
This is called an Infinite Prisoner’s Dilemma, and it’s a literal game changer. That’s because the gingerbread men can now use their future decisions as bargaining chips for the present ones. Consider this strategy: both agree to spare each other every day. If one ever chooses to sacrifice, the other will retaliate by choosing “sacrifice” for the rest of eternity. So is that enough to get these poor sentient baked goods to agree to cooperate?
Ezt nevezik Végtelen Fogolydilemmának, és ettől gyökeresen megváltozik minden. Mert a mézeskalács-emberkék mostantól felhasználhatják jövőbeli döntéseiket tárgyalási alapként az aktuális helyzetben. Legyen ez a stratégia: megegyeznek, hogy mindennap megkímélik egymást. Ha egyikük egyszer a feláldozást választja, akkor a másik megtorolja, és feláldozza őt az az idők végezetéig. Elég ennyi ahhoz, hogy rávegyük szegény érző szívű sütiket, hogy vállalják az együttműködést?
To figure that out, we have to factor in another consideration: the gingerbread men probably care about the future less than they care about the present. In other words, they might discount how much they care about their future limbs by some number, which we’ll call delta. This is similar to the idea of inflation eroding the value of money. If delta is one half, on day one they care about day 2 limbs half as much as day 1 limbs, day 3 limbs 1 quarter as much as day 1 limbs, and so on.
Hogy ezt kitaláljuk, számolnunk kell egy másik szemponttal: a mézeskalács-emberkék valószínűleg kevésbé törődnek a jövővel, mint amennyire a jelen érdekli őket. Más szavakkal, talán kevésbé értékelik, hogy mennyire törődnek a jövőbeni végtagok számával, amit most deltának fogunk hívni. Ez hasonló az infláció gondolatához, ami csökkenti a pénz értékét. Ha a delta értéke egyketted (fél), az 1. napon feleannyira törődnek a 2. nap végtagjaival, mint az 1. napi végtagokkal, a 3. napi végtagokkal negyedannyira, mint az 1. nap végtagjaival stb.
A delta of 0 means that they don’t care about their future limbs at all, so they’ll repeat their initial choice of mutual sacrifice endlessly. But as delta approaches 1, they’ll do anything possible to avoid the pain of infinite triple limb consumption, which means they’ll choose to spare each other. At some point in between they could go either way. We can find out where that point is by writing the infinite series that represents each strategy, setting them equal to each other, and solving for delta.
Ha a delta 0, úgy egyáltalán nem törődnek a jövőbeli végtagokkal, és megismétlik a kezdeti döntésüket kölcsönösen feláldozva egymást. De ahogy a delta közeledik az 1-hez, mindent megtesznek, hogy elkerüljék a három végtag elfogyasztásának véget nem érő fájdalmát, ami azt jelenti, hogy inkább választják azt, hogy megkímélik egymást. Valahol a kettő között bármelyik irányba mehetnek. Megtudhatjuk, hogy hol van ez a pont, ha felírjuk a végtelen sorozatot, amely az egyes stratégiákat kifejezi, egyenlővé tesszük őket egymással, és megoldjuk deltára.
That yields 1/3, meaning that as long as Crispy and Chewy care about tomorrow at least 1/3 as much as today, it’s optimal for them to spare and cooperate forever.
Az eredmény 1/3, vagyis amennyiben Ropi és Rágcsa a holnapot legalább 1/3 annyira értékeli, mint a mai napot, a legkedvezőbb lesz számukra megkímélni egymást és együttműködni.
This analysis isn’t unique to cookies and wizards; we see it play out in real-life situations like trade negotiations and international politics. Rational leaders must assume that the decisions they make today will impact those of their adversaries tomorrow. Selfishness may win out in the short-term, but with the proper incentives, peaceful cooperation is not only possible, but demonstrably and mathematically ideal.
Ez az elemzés nem kivételesen sütikhez és varázslókhoz készült, megtörténik olyan valós élethelyzetekben, mint a kereskedelmi tárgyalások és a nemzetközi politika. A racionális vezetőknek vállalniuk kell, hogy a ma meghozott döntéseiknek hatása lesz az ellenfeleikre holnap. Az önzés rövid távon nyerő lehet, de megfelelő ösztönzőkkel a békés együttműködés nemcsak lehetséges, de bizonyítható és matematikailag ideális.
As for the gingerbread men, their eternity may be pretty crumby, but so long as they go out on a limb, their friendship will never again be half-baked.
Ami a mézeskalács-emberkéket illeti, örökkévalóságuk eléggé törékeny lehet, de amíg egy végtaggal is együtt vannak, barátságuk soha többé nem lesz félig nyers.