Two perfectly rational gingerbread men, Crispy and Chewy, are out strolling when they’re caught by a fox. Seeing how happy they are, he decides that, instead of simply eating them, he’ll put their friendship to the test with a cruel dilemma. He’ll ask each gingerbread man whether he’d opt to Spare or Sacrifice the other. They can discuss, but neither will know what the other chose until their decisions are locked in.
Dua manusia jahe yang sangat rasional, Crispy dan Chewy, sedang jalan-jalan saat tertangkap oleh rubah. Melihat betapa senangnya mereka, si rubah memutuskan daripada memakan mereka, dia akan tes persahabatan mereka dengan dilema yang kejam. Dia akan tanya apa mereka akan mengampuni atau mengorbankan temannya. Mereka boleh berdiskusi, tapi tak ada yang tahu pilihan temannya sampai keputusannya sudah bulat.
If both choose to spare the other, the fox will eat just one of each of their limbs; if one chooses to spare while the other sacrifices, the sparer will be fully eaten, while the traitor will run away with all his limbs intact. Finally, if both choose to sacrifice, the fox will eat 3 limbs from each.
Jika keduanya memilih mengampuni yang lain, si rubah hanya akan memakan satu anggota tubuh mereka. Jika satu memilih mengampuni, sedangkan yang lain mengorbankan, yang mengampuni akan dimakan habis, sedangkan yang berkhianat bisa lolos dengan utuh. Terakhir, jika keduanya mengorbankan, si rubah akan memakan tiga anggota tubuh dari setiap jahe.
In game theory, this scenario is called the “Prisoner's Dilemma.” To figure out how these gingerbread men will act in their perfect rationality, we can map the outcomes of each decision. The rows represent Crispy’s choices, and the columns are Chewy’s. Meanwhile, the numbers in each cell represent the outcomes of their decisions, as measured in the number of limbs each would keep:
Dalam teori permainan, skenario ini disebut "Dilema Tahanan". Untuk tahu bagaimana manusia jahe ini akan bertindak dengan sangat rasional, kita bisa memetakan hasil dari setiap keputusan. Baris ini adalah pilihan Crispy, dan kolomnya adalah pilihan Chewy. Sedangkan angka di setiap sel adalah hasil keputusan mereka yang diukur dengan jumlah anggota tubuh mereka yang masih ada.
So do we expect their friendship to last the game?
Jadi, apa kita berharap persahabatan mereka akan bertahan?
First, let’s consider Chewy’s options. If Crispy spares him, Chewy can run away scot-free by sacrificing Crispy. But if Crispy sacrifices him, Chewy can keep one of his limbs if he also sacrifices Crispy. No matter what Crispy decides, Chewy always experiences the best outcome by choosing to sacrifice his companion. The same is true for Crispy.
Pertama, kita pertimbangkan pilihan Chewy. Jika Crispy mengampuni, Chewy bisa lolos dengan mengorbankan Crispy. Tapi jika Crispy mengorbankan Chewy, satu anggota tubuh Chewy bisa selamat jika Chewy juga mengorbankan Crispy. Apa pun keputusan Crispy, Chewy selalu dapat hasil terbaik dengan memilih mengorbankan temannya. Begitu juga dengan Crispy.
This is the standard conclusion of the Prisoner's Dilemma: the two characters will betray one another. Their strategy to unconditionally sacrifice their companion is what game theorists call the “Nash Equilibrium," meaning that neither can gain by deviating from it.
Ini kesimpulan standar dari Dilema Tahanan: kedua karakter itu akan saling berkhianat. Strategi mereka untuk mengorbankan teman tanpa syarat ini disebut "Ekuilibrium Nash" dalam teori permainan, artinya mereka tak akan untung jika tak melakukan itu.
Crispy and Chewy act accordingly and the smug fox runs off with a belly full of gingerbread, leaving the two former friends with just one leg to stand on.
Crispy dan Chewy pun melakukan itu, dan si rubah sombong itu pergi dengan perut yang penuh roti jahe, sementara kedua mantan teman itu hanya punya satu kaki untuk berdiri.
Normally, this is where the story would end, but a wizard happened to be watching the whole mess unfold. He tells Crispy and Chewy that, as punishment for betraying each other, they’re doomed to repeat this dilemma for the rest of their lives, starting with all four limbs at each sunrise. Now what happens?
Biasanya, di sinilah cerita ini akan berakhir, tapi seorang penyihir kebetulan melihat seluruh kekacauan itu. Dia beri tahu Crispy dan Chewy, sebagai hukuman karena saling berkhianat, mereka akan mengulangi dilema ini seumur hidup, dimulai dengan anggota tubuh yang lengkap setiap matahari terbit. Sekarang, apa yang terjadi?
This is called an Infinite Prisoner’s Dilemma, and it’s a literal game changer. That’s because the gingerbread men can now use their future decisions as bargaining chips for the present ones. Consider this strategy: both agree to spare each other every day. If one ever chooses to sacrifice, the other will retaliate by choosing “sacrifice” for the rest of eternity. So is that enough to get these poor sentient baked goods to agree to cooperate?
Ini disebut Dilema Tahanan Berulang Berkelanjutan, dan ini benar-benar mengubah permainan. Itu karena para manusia jahe itu sekarang bisa menggunakan keputusan mereka berikutnya sebagai alat tawar untuk keputusan yang sekarang. Pertimbangkan strategi ini: keduanya setuju saling mengampuni setiap hari. Jika salah satu memilih mengorbankan, yang lain akan membalas dengan memilih mengorbankan selamanya. Jadi, apa itu cukup bagi manusia jahe rasional yang malang ini untuk setuju bekerja sama?
To figure that out, we have to factor in another consideration: the gingerbread men probably care about the future less than they care about the present. In other words, they might discount how much they care about their future limbs by some number, which we’ll call delta. This is similar to the idea of inflation eroding the value of money. If delta is one half, on day one they care about day 2 limbs half as much as day 1 limbs, day 3 limbs 1 quarter as much as day 1 limbs, and so on.
Untuk mengetahuinya, kita harus pertimbangkan hal lain: para manusia jahe itu mungkin tak begitu peduli pada masa depan dibandingkan masa sekarang. Dengan kata lain, mereka mungkin mengurangi kepedulian mereka pada anggota tubuh di masa depan dengan jumlah tertentu, yang akan kita sebut delta. Ini mirip dengan gagasan inflasi yang mengikis nilai uang. Jika deltanya setengah, pada hari pertama, kepedulian mereka pada hari kedua setengah dari hari pertama, kepedulian pada hari ketiga seperempat dari hari pertama,
A delta of 0 means that they don’t care about their future limbs at all, so they’ll repeat their initial choice of mutual sacrifice endlessly. But as delta approaches 1, they’ll do anything possible to avoid the pain of infinite triple limb consumption, which means they’ll choose to spare each other. At some point in between they could go either way. We can find out where that point is by writing the infinite series that represents each strategy, setting them equal to each other, and solving for delta.
dan seterusnya. Delta 0 berarti mereka sama sekali tak peduli pada anggota tubuh mereka. Jadi, mereka akan terus mengulangi pilihan awal untuk saling mengorbangkan. Tapi saat delta mendekati 1, mereka akan melakukan apa pun agar tiga anggota tubuhnya tak dimakan selamanya. Berarti mereka akan memilih untuk saling mengampuni. Di satu titik antara delta 0 dan 1, mereka bisa memilih apa saja. Kita bisa mencari tahu letak titik itu dengan menulis rangkaian tak terbatas yang mewakili setiap strategi, menyetarakan kedua persamaan, dan menghitung deltanya.
That yields 1/3, meaning that as long as Crispy and Chewy care about tomorrow at least 1/3 as much as today, it’s optimal for them to spare and cooperate forever.
Hasilnya 1/3, berarti selama kepedulian Crispy dan Chewy pada hari esok minimal 1/3 kepedulian pada hari ini, mengampuni dan bekerja sama selamanya adalah pilihan optimal bagi mereka.
This analysis isn’t unique to cookies and wizards; we see it play out in real-life situations like trade negotiations and international politics. Rational leaders must assume that the decisions they make today will impact those of their adversaries tomorrow. Selfishness may win out in the short-term, but with the proper incentives, peaceful cooperation is not only possible, but demonstrably and mathematically ideal.
Analisis ini tak hanya berlaku untuk kue dan penyihir. Kita melihatnya terjadi dalam situasi nyata, seperti negosiasi perdagangan dan politik internasional. Pemimpin rasional harus berasumsi bahwa keputusan mereka hari ini akan berdampak pada keputusan musuh mereka besok. Keegoisan mungkin menang dalam jangka pendek, tapi dengan insentif yang tepat, kerja sama damai tak hanya mungkin, tapi juga ideal secara matematis dan terbukti.
As for the gingerbread men, their eternity may be pretty crumby, but so long as they go out on a limb, their friendship will never again be half-baked.
Sedangkan para manusia jahe itu, mereka mungkin akan menjadi remah-remah, tapi selama mereka mau mengambil risiko, persahabatan mereka tak akan pernah lemah lagi.