Two perfectly rational gingerbread men, Crispy and Chewy, are out strolling when they’re caught by a fox. Seeing how happy they are, he decides that, instead of simply eating them, he’ll put their friendship to the test with a cruel dilemma. He’ll ask each gingerbread man whether he’d opt to Spare or Sacrifice the other. They can discuss, but neither will know what the other chose until their decisions are locked in.
Два вполне разумных пряничных человечка Хрустик и Сдобик гуляли себе по лесу, как вдруг угодили в лапы коварному лису. Увидев, как им вдвоём хорошо, он решает вместо того, чтобы просто съесть человечков, испытать их дружбу на прочность, поставив их перед страшным выбором. Он спросит каждого пряничка, захочет ли тот спасти своего друга или пожертвовать им. Они могут обсудить это друг с другом, но прежде чем примут окончательные решения,
If both choose to spare the other, the fox will eat just one of each of their limbs;
никто так и не узнает, какой выбор сделал его товарищ.
if one chooses to spare while the other sacrifices, the sparer will be fully eaten, while the traitor will run away with all his limbs intact. Finally, if both choose to sacrifice, the fox will eat 3 limbs from each.
Если оба выберут спасти друг друга, то лис откусит у каждого по одной ножке, если один выберет спасти другого, а второй — пожертвовать товарищем, то он съест спасителя, а предатель сможет уйти восвояси целым и невредимым. Наконец, если оба выберут пожертвовать друг другом, то лис отгрызёт каждому обе ножки и по одной ручке.
In game theory, this scenario is called the “Prisoner's Dilemma.” To figure out how these gingerbread men will act in their perfect rationality, we can map the outcomes of each decision. The rows represent Crispy’s choices, and the columns are Chewy’s. Meanwhile, the numbers in each cell represent the outcomes of their decisions, as measured in the number of limbs each would keep:
В теории игр данный сценарий называется дилемма заключённого. Чтобы понять, как поступят наши рациональные пряничные человечки, изобразим в виде схемы результаты принятия решения каждым из них. По горизонтали мы видим варианты Хрустика, а в колонках по вертикали — Сдобика. Цифры в каждой ячейке обозначают результаты решений, если измерять их по числу оставшихся ножек и ручек.
So do we expect their friendship to last the game?
Как вы думаете, сыграв в эту игру, останутся ли они друзьями?
First, let’s consider Chewy’s options. If Crispy spares him, Chewy can run away scot-free by sacrificing Crispy. But if Crispy sacrifices him, Chewy can keep one of his limbs if he also sacrifices Crispy. No matter what Crispy decides, Chewy always experiences the best outcome by choosing to sacrifice his companion. The same is true for Crispy.
Вначале давайте рассмотрим варианты для Сдобика. Если Хрустик пощадит его, Сдобик сможет выбраться из когтей лиса, пожертвовав Хрустиком. Но если Хрустик предаст его, Сдобик сможет сохранить ручку, в свою очередь предав Хрустика. Что бы ни решил Хрустик, Сдобик всегда будет в выигрыше, если решит пожертвовать товарищем. У Хрустика всё то же самое.
This is the standard conclusion of the Prisoner's Dilemma: the two characters will betray one another. Their strategy to unconditionally sacrifice their companion is what game theorists call the “Nash Equilibrium," meaning that neither can gain by deviating from it.
И мы приходим к стандартному выводу в дилемме заключённого — двое пленников вынуждены предать друг друга. Стратегия, когда каждый из участником неизбежно жертвует своим товарищем, известна в теории игр под названием «равновесие Нэша» и означает, что ни один из игроков не выиграет, если изменит стратегию.
Crispy and Chewy act accordingly and the smug fox runs off with a belly full of gingerbread, leaving the two former friends with just one leg to stand on.
Хрустик и Сдобик поведут себя согласно этому правилу, а самодовольный лис, от души набив брюхо вкусными пряниками, оставит друзьям по одной ножке.
Normally, this is where the story would end, but a wizard happened to be watching the whole mess unfold. He tells Crispy and Chewy that, as punishment for betraying each other, they’re doomed to repeat this dilemma for the rest of their lives, starting with all four limbs at each sunrise. Now what happens?
Обычно именно здесь история и закончилась бы, но так случилось, что за всеми этими злоключениями наблюдал добрый волшебник. В наказание за предательство он приговаривает Хрустика и Сдобика до конца дней своих снова и снова переживать эту дилемму, и с восходом солнца у них будут вновь отрастать ручки и ножки. Что же случится теперь?
This is called an Infinite Prisoner’s Dilemma, and it’s a literal game changer. That’s because the gingerbread men can now use their future decisions as bargaining chips for the present ones. Consider this strategy: both agree to spare each other every day. If one ever chooses to sacrifice, the other will retaliate by choosing “sacrifice” for the rest of eternity. So is that enough to get these poor sentient baked goods to agree to cooperate?
Это называется бесконечная дилемма заключённого, и игра отныне пойдёт совсем по-другому. Теперь пряничные человечки могут использовать свои будущие решения в качестве инструментов торга в настоящем. Представьте себе следующую стратегию: оба договорятся через день спасать друг друга. Даже если сегодня один выберет пожертвовать другим, то завтра другой «отомстит» ему, пожертвовав им же, и так до бесконечности. Достаточно ли этого, чтобы наши бедные разумные коврижки
To figure that out, we have to factor in another consideration: the gingerbread men probably care about the future less than they care about the present. In other words, they might discount how much they care about their future limbs by some number, which we’ll call delta. This is similar to the idea of inflation eroding the value of money. If delta is one half, on day one they care about day 2 limbs half as much as day 1 limbs, day 3 limbs 1 quarter as much as day 1 limbs, and so on.
согласились сотрудничать? Чтобы это выяснить, нам необходимо принять во внимание кое-что ещё: скорее всего, пряничных человечков собственное будущее заботит гораздо меньше, чем настоящее. Другими словами, они, возможно, могут в будущем пренебречь своими ручками и ножками на некое число, которое мы обозначим дельтой. Это похоже на то, как из-за инфляции обесцениваются деньги. Если дельта составляет одну вторую, то в день 1 они в два раза меньше беспокоятся по поводу частей тела в день 2, чем в день 1, в день 3 — примерно на четверть от дня 1 и так далее.
A delta of 0 means that they don’t care about their future limbs at all, so they’ll repeat their initial choice of mutual sacrifice endlessly. But as delta approaches 1, they’ll do anything possible to avoid the pain of infinite triple limb consumption, which means they’ll choose to spare each other. At some point in between they could go either way. We can find out where that point is by writing the infinite series that represents each strategy, setting them equal to each other, and solving for delta.
При дельта равной нулю, конечности их и вовсе не заботят, поэтому они будут раз за разом повторять первоначальный выбор и жертвовать друг другом. Но при приближении дельта к 1 они постараются всеми силами избежать боли от бесконечного лишения себя трёх конечностей сразу, а это означает, что они решат спасти друг друга. Где-то в этом промежутке, скорее всего, они изменят стратегию. Мы можем обнаружить точку, в которой это произойдёт, написав бесконечную последовательность, которая соответствует каждой стратегии, и, сопоставив их друг с другом, мы получим решение для дельты.
That yields 1/3, meaning that as long as Crispy and Chewy care about tomorrow at least 1/3 as much as today, it’s optimal for them to spare and cooperate forever.
Ответ будет 1/3, это означает, что пока Хрустик и Сдобик заботятся о будущем хотя бы на 1/3 от настоящего, то наиболее подходящей стратегией для них будет сотрудничество.
This analysis isn’t unique to cookies and wizards; we see it play out in real-life situations like trade negotiations and international politics. Rational leaders must assume that the decisions they make today will impact those of their adversaries tomorrow. Selfishness may win out in the short-term, but with the proper incentives, peaceful cooperation is not only possible, but demonstrably and mathematically ideal.
Подобный анализ не проводится только на пряниках и волшебниках, мы часто сталкиваемся с подобными ситуациями в реальной жизни в таких сферах, как торговые переговоры и международная политика. Здравомыслящие лидеры должны понимать, что принимаемые ими сегодня решения окажут влияние на их соперников в будущем. В краткосрочном периоде эгоцентризм принесёт результаты, но при должной заинтересованности мирное сотрудничество не только очевидно, но и оптимально с точки зрения математики.
As for the gingerbread men, their eternity may be pretty crumby, but so long as they go out on a limb, their friendship will never again be half-baked.
Что же касается пряничных человечков, пусть их ждёт не самое сладкое будущее, но пока они смогут передвигаться хотя бы на одной ножке, «пригорание» их дружбе точно не грозит.