Two perfectly rational gingerbread men, Crispy and Chewy, are out strolling when they’re caught by a fox. Seeing how happy they are, he decides that, instead of simply eating them, he’ll put their friendship to the test with a cruel dilemma. He’ll ask each gingerbread man whether he’d opt to Spare or Sacrifice the other. They can discuss, but neither will know what the other chose until their decisions are locked in.
Có hai anh bạn bánh gừng siêu lí trí kia, Crispy và Chewy, đang đi dạo ngoài trời thì bị một con cáo bắt gặp. Thấy hai anh đang hí hửng vui vẻ, anh ta quyết định, thay vì ăn hai người, cáo quyết định đặt tình bạn của họ vào một song đề tàn nhẫn. Cáo hỏi mỗi anh là muốn cáo tha hay ăn bạn mình. Họ được phép thảo luận, nhưng không ai biết người kia chọn gì tới khi cả hai chốt đáp án.
If both choose to spare the other, the fox will eat just one of each of their limbs; if one chooses to spare while the other sacrifices, the sparer will be fully eaten, while the traitor will run away with all his limbs intact. Finally, if both choose to sacrifice, the fox will eat 3 limbs from each.
Nếu hai người chọn tha cho nhau, cáo sẽ chỉ ăn một chi của mỗi người. Nếu một người chọn tha còn người kia chọn ăn thịt, thì người chọn tha sẽ bị ăn thịt, còn người phản bội kia sẽ được thả đi với tứ chi nguyên vẹn. Nếu cả hai chọn ăn thịt, cáo sẽ ăn ba chi của mỗi người.
In game theory, this scenario is called the “Prisoner's Dilemma.” To figure out how these gingerbread men will act in their perfect rationality, we can map the outcomes of each decision. The rows represent Crispy’s choices, and the columns are Chewy’s. Meanwhile, the numbers in each cell represent the outcomes of their decisions, as measured in the number of limbs each would keep:
Trong lý thuyết trò chơi, tình huống này được gọi là Song Đề Tù Nhân. Để biết hai anh bánh gừng này xử lý sao với lý trí hoàn hảo của họ, ta hãy xem xét các kết quả của từng quyết định của họ. Hàng ngang là quyết định của Crispy, cột dọc là quyết định của Chewy. Các số trong các ô biểu trưng cho kết quả các lựa chọn của họ, và được tính bằng số chi mà mỗi người còn giữ được.
So do we expect their friendship to last the game?
Vậy thì tình nghĩa anh em có chắc bền lâu đối với hai anh này?
First, let’s consider Chewy’s options. If Crispy spares him, Chewy can run away scot-free by sacrificing Crispy. But if Crispy sacrifices him, Chewy can keep one of his limbs if he also sacrifices Crispy. No matter what Crispy decides, Chewy always experiences the best outcome by choosing to sacrifice his companion. The same is true for Crispy.
Đầu tiên, hãy xét lựa chọn của Chewy. Nếu Crispy chọn tha cho Chewy, Chewy sẽ không sao nếu Chewy chọn hy sinh Crispy. Nếu Crispy chọn hy sinh Chewy, Chewy bảo toàn được một chi của mình nếu Chewy cũng chọn hy sinh Crispy. Dù Crispy chọn như nào, thì Chewy cũng có lợi hơn nếu Chewy chọn hy sinh bạn mình. Nếu ngược lại thì cũng thế.
This is the standard conclusion of the Prisoner's Dilemma: the two characters will betray one another. Their strategy to unconditionally sacrifice their companion is what game theorists call the “Nash Equilibrium," meaning that neither can gain by deviating from it.
Đây là cái kết phổ biến của Song đề tù nhân. hai người lúc nào cũng sẽ phản nhau. Họ sẽ hy sinh bạn họ bất kể giá nào. Các nhà lý thuyết trò chơi gọi cái này là "Cân bằng Nash", nghĩa là không ai được lợi nếu không phản bội người kia.
Crispy and Chewy act accordingly and the smug fox runs off with a belly full of gingerbread, leaving the two former friends with just one leg to stand on.
Crispy và Chewy hành động như dự đoán và con cáo tự cao kia sẽ được một bụng bánh gừng no bụng. Và hai anh cựu bạn thân, mỗi người còn lại một chân.
Normally, this is where the story would end, but a wizard happened to be watching the whole mess unfold. He tells Crispy and Chewy that, as punishment for betraying each other, they’re doomed to repeat this dilemma for the rest of their lives, starting with all four limbs at each sunrise. Now what happens?
Thường thì câu chuyện này kết thúc như thế nhưng có một ông phù thùy đã tình cờ thấy cái sai của hai anh. Ông ta bảo Crispy và Chewy rằng, để phạt hai người vì tội phản bội nhau, hai người sẽ phải gặp lại song đề này tới cuối của đời họ. Mỗi sáng mỗi anh sẽ có đủ chân tay. Bây giờ thì sao?
This is called an Infinite Prisoner’s Dilemma, and it’s a literal game changer. That’s because the gingerbread men can now use their future decisions as bargaining chips for the present ones. Consider this strategy: both agree to spare each other every day. If one ever chooses to sacrifice, the other will retaliate by choosing “sacrifice” for the rest of eternity. So is that enough to get these poor sentient baked goods to agree to cooperate?
Đây gọi là Song Đề Tù Nhân Vô Tận, nó thay đổi cả một cuộc chơi. Đó là vì hai anh bánh gừng có thể sử dụng những quyết định tương lai như con bài thương lượng cho những thứ hiện tại. Hãy xem chiến thuật này: hai người đồng ý tha cho nhau mỗi ngày. Nếu ai mà chọn hy sinh người kia, người kia sẽ trả thù bằng việc chọn hy sinh bạn mình vĩnh viễn. Như vậy có đủ để hai cái bánh gừng chúng sinh tội nghiệp này đồng ý hợp tác?
To figure that out, we have to factor in another consideration: the gingerbread men probably care about the future less than they care about the present. In other words, they might discount how much they care about their future limbs by some number, which we’ll call delta. This is similar to the idea of inflation eroding the value of money. If delta is one half, on day one they care about day 2 limbs half as much as day 1 limbs, day 3 limbs 1 quarter as much as day 1 limbs, and so on.
Để biết rõ, mình phải xem xét một yếu tố nữa: hai anh bánh gừng chắc hẳn quan tâm về tương lai ít hơn là quan tâm tới hiện tại. Nói cách khác, họ có lẽ coi nhẹ việc họ quan tâm về số lượng chi của họ ở tương lai. Ta gọi số lượng chi này là delta. Điều này giống như lạm phát tiền tệ. Nếu delta là một phần hai, ngày một họ quan tâm về số chi ngày hai bằng nửa sự quan tâm về số chi ngày một, ngày ba bằng một phần tư ngày một, và cứ tương tự vậy.
A delta of 0 means that they don’t care about their future limbs at all, so they’ll repeat their initial choice of mutual sacrifice endlessly. But as delta approaches 1, they’ll do anything possible to avoid the pain of infinite triple limb consumption, which means they’ll choose to spare each other. At some point in between they could go either way. We can find out where that point is by writing the infinite series that represents each strategy, setting them equal to each other, and solving for delta.
Delta bằng 0 là họ không thèm quan tâm về số lượng chi trên người họ ra sao nữa, nghĩa là họ cứ tiếp tục lựa chọn hy sinh lẫn nhau mãi mãi. Nhưng mà khi delta tiến về một, họ sẽ làm mọi cách để tránh nỗi đau vô vàn khi bị ăn ba chi, nghĩa là họ sẽ tha cho nhau. Tại một điểm nào đó ở giữa, họ có thể chọn một trong hai. Ta có thể tìm ra thời điểm đó là khi nào bằng cách viết ra hết chuỗi quyết định ở mỗi phương pháp lựa chọn, cho chúng bằng nhau và tìm delta.
That yields 1/3, meaning that as long as Crispy and Chewy care about tomorrow at least 1/3 as much as today, it’s optimal for them to spare and cooperate forever.
Kết quả bằng một phần ba, nghĩa là nếu Crispy và Chewy quan tâm về ngày mai ít nhất bằng một phần ba hiện tại, chiến thuật tốt nhất cho họ là chọn tha cho nhau và hợp tác với nhau mãi.
This analysis isn’t unique to cookies and wizards; we see it play out in real-life situations like trade negotiations and international politics. Rational leaders must assume that the decisions they make today will impact those of their adversaries tomorrow. Selfishness may win out in the short-term, but with the proper incentives, peaceful cooperation is not only possible, but demonstrably and mathematically ideal.
Các phân tích này không chỉ có ở câu chuyện bánh qui và phù thùy; ta cũng thấy nó xuất hiện cả ở đời sống thường nhật giống như thương lượng về thương mại và chính trị quốc tế. Các lãnh đạo lí trí phải luôn cho rằng quyết định của họ hôm nay sẽ ảnh hưởng đối thủ của họ ngày mai. Ích kỷ chỉ được lợi một thời gian ngắn, nhưng để được cái lợi dài lâu hợp tác hòa bình là một lựa chọn tốt nhất và hiệu quả nhất theo chứng minh toán học.
As for the gingerbread men, their eternity may be pretty crumby, but so long as they go out on a limb, their friendship will never again be half-baked.
Cũng như các anh bánh gừng, cuộc đời các anh hơi vương vãi nhưng miễn là chịu đi chơi cùng nhau dù với chỉ một chân, tình bạn tốt hai anh sẽ mãi mãi bền lâu.