Two perfectly rational gingerbread men, Crispy and Chewy, are out strolling when they’re caught by a fox. Seeing how happy they are, he decides that, instead of simply eating them, he’ll put their friendship to the test with a cruel dilemma. He’ll ask each gingerbread man whether he’d opt to Spare or Sacrifice the other. They can discuss, but neither will know what the other chose until their decisions are locked in.
Dois bonequinhos de biscoito de gengibre perfeitamente racionais, Crispy e Chewy, estão passeando, quando são pegos por uma raposa. Vendo como eles estão felizes, em vez de simplesmente comê-los, ela decide colocar a amizade deles à prova com um dilema cruel. Ela irá perguntar a cada bonequinho se opta por poupar ou sacrificar o outro. Eles podem discutir, mas nenhum saberá o que o outro escolheu até que suas decisões sejam travadas.
If both choose to spare the other, the fox will eat just one of each of their limbs; if one chooses to spare while the other sacrifices, the sparer will be fully eaten, while the traitor will run away with all his limbs intact. Finally, if both choose to sacrifice, the fox will eat 3 limbs from each.
Se ambos escolherem poupar o outro, a raposa comerá só um membro de cada bonequinho; se um escolher poupar enquanto o outro sacrificar, aquele que poupar será totalmente comido, enquanto o traidor fugirá com todos os membros intactos. Por fim, se ambos escolherem sacrificar, a raposa comerá três membros de cada bonequinho.
In game theory, this scenario is called the “Prisoner's Dilemma.” To figure out how these gingerbread men will act in their perfect rationality, we can map the outcomes of each decision. The rows represent Crispy’s choices, and the columns are Chewy’s. Meanwhile, the numbers in each cell represent the outcomes of their decisions, as measured in the number of limbs each would keep:
Na teoria dos jogos, esse cenário é chamado de "dilema do prisioneiro". Para descobrir como esses bonequinhos agirão em sua racionalidade perfeita, podemos mapear os resultados de cada decisão. As linhas representam as escolhas de Crispy; as colunas, as de Chewy. Enquanto isso, os números em cada célula representam os resultados de suas decisões,
So do we expect their friendship to last the game?
de acordo com o número de membros que cada um manteria.
First, let’s consider Chewy’s options.
Será que a amizade deles irá durar após o jogo?
If Crispy spares him, Chewy can run away scot-free by sacrificing Crispy. But if Crispy sacrifices him, Chewy can keep one of his limbs if he also sacrifices Crispy. No matter what Crispy decides, Chewy always experiences the best outcome by choosing to sacrifice his companion. The same is true for Crispy.
Primeiro, vamos considerar as opções de Chewy. Se Crispy o poupar, Chewy poderá escapar impune ao sacrificar Crispy. Mas, se Crispy o sacrificar, Chewy pode manter um de seus membros se ele também sacrificar Crispy. Não importa o que Crispy decida, Chewy sempre terá o melhor resultado ao escolher sacrificar seu companheiro. O mesmo vale para Crispy.
This is the standard conclusion of the Prisoner's Dilemma: the two characters will betray one another. Their strategy to unconditionally sacrifice their companion is what game theorists call the “Nash Equilibrium," meaning that neither can gain by deviating from it.
Esta é a conclusão padrão do dilema do prisioneiro: os dois personagens trairão um ao outro. A estratégia deles para sacrificar incondicionalmente seu companheiro é o que os teóricos dos jogos chamam de "equilíbrio de Nash", o que significa que nenhum dos dois pode ganhar se desviando dele.
Crispy and Chewy act accordingly and the smug fox runs off with a belly full of gingerbread, leaving the two former friends with just one leg to stand on.
Crispy e Chewy agem do modo devido, e a raposa presunçosa foge com a barriga cheia de biscoito de gengibre, deixando os dois ex-amigos com apenas uma perna para se sustentar.
Normally, this is where the story would end, but a wizard happened to be watching the whole mess unfold. He tells Crispy and Chewy that, as punishment for betraying each other, they’re doomed to repeat this dilemma for the rest of their lives, starting with all four limbs at each sunrise. Now what happens?
Normalmente, a história termina aqui, mas um mago está assistindo ao desenrolar de toda essa confusão. Ele diz a Crispy e Chewy que, como punição por traírem um ao outro, eles estão condenados a repetir esse dilema pelo resto da vida, começando com todos os quatro membros a cada nascer do sol. Agora o que acontece?
This is called an Infinite Prisoner’s Dilemma, and it’s a literal game changer. That’s because the gingerbread men can now use their future decisions as bargaining chips for the present ones. Consider this strategy: both agree to spare each other every day. If one ever chooses to sacrifice, the other will retaliate by choosing “sacrifice” for the rest of eternity. So is that enough to get these poor sentient baked goods to agree to cooperate?
Esse é o dilema do prisioneiro iterado e afeta muito o resultado do jogo. Isso porque os bonequinhos podem usar agora suas decisões futuras como moeda de troca para as decisões atuais. Considere esta estratégia: ambos concordam em poupar um ao outro todos os dias. Se um deles decidir se sacrificar, o outro revidará escolhendo "sacrificar" pelo resto da eternidade. Então, será que isso basta para fazer com que esses pobres bonequinhos concordem em cooperar?
To figure that out, we have to factor in another consideration: the gingerbread men probably care about the future less than they care about the present. In other words, they might discount how much they care about their future limbs by some number, which we’ll call delta. This is similar to the idea of inflation eroding the value of money. If delta is one half, on day one they care about day 2 limbs half as much as day 1 limbs, day 3 limbs 1 quarter as much as day 1 limbs, and so on.
Para descobrirmos, devemos levar outro fator em consideração: talvez os bonequinhos se importem menos com o futuro do que com o presente. Em outras palavras, eles podem ignorar o quanto se importam com seus membros futuros por um certo número, que chamaremos de delta. Isso é semelhante à ideia da inflação desvalorizando o dinheiro. Se delta for igual a meio, no primeiro dia, eles se importam com os membros do segundo dia a metade do que os do primeiro dia; os membros do terceiro dia, um quarto do que os do primeiro dia;
A delta of 0 means that they don’t care about their future limbs at all,
e assim por diante.
so they’ll repeat their initial choice of mutual sacrifice endlessly. But as delta approaches 1, they’ll do anything possible to avoid the pain of infinite triple limb consumption, which means they’ll choose to spare each other. At some point in between they could go either way. We can find out where that point is by writing the infinite series that represents each strategy, setting them equal to each other, and solving for delta.
Um delta de zero significa que não se importam nem um pouco com seus membros futuros. Então eles irão repetir indefinidamente sua escolha inicial de sacrifício mútuo. Mas, à medida que o delta se aproximar de um, eles farão de tudo para evitar a dor do consumo infinito de três membros, o que significa que escolherão poupar um ao outro. Em algum momento, os bonequinhos poderiam decidir por qualquer opção. Podemos descobrir quando é esse momento escrevendo a série infinita que representa cada estratégia, definindo-as iguais umas às outras e resolvendo para delta.
That yields 1/3, meaning that as long as Crispy and Chewy care about tomorrow at least 1/3 as much as today, it’s optimal for them to spare and cooperate forever.
Isso dá 1/3, ou seja, desde que Crispy e Chewy se importem com o amanhã pelo menos 1/3 do que hoje,
This analysis isn’t unique to cookies and wizards;
é ideal que poupem e cooperem para sempre.
we see it play out in real-life situations like trade negotiations and international politics. Rational leaders must assume that the decisions they make today will impact those of their adversaries tomorrow. Selfishness may win out in the short-term, but with the proper incentives, peaceful cooperation is not only possible, but demonstrably and mathematically ideal.
Essa análise não é exclusiva para biscoitos e magos; nós a vemos acontecer em situações da vida real, como negociações comerciais e política internacional. Líderes racionais devem presumir que as decisões que tomam hoje terão impacto amanhã nas decisões de seus adversários. O egoísmo pode vencer no curto prazo, mas, com os incentivos adequados, a cooperação pacífica não é só possível,
As for the gingerbread men, their eternity may be pretty crumby, but so long as they go out on a limb, their friendship will never again be half-baked.
mas demonstrável e matematicamente ideal. Aos bonequinhos de biscoito de gengibre, a eternidade pode ser bem desagradável, mas, enquanto eles se arriscarem,