囚徒困境與賽局理論

演講時間:2016/01/04

主講者:林澤民,台大電機系畢業,美國明尼蘇達大學政治學博士,現任教於美國德州大學奧斯汀校區政府系。在泛科學刊登囚徒困境系列
澤民教授開場即說,德州大學每個系的學生均有寫作課,而他開設的是與賽局理論有關,以英文寫十頁內容,且一學期交三篇文章,文章內容以囚徒困境來應用於電影、故事、日常生活。

賽局理論,考慮遊戲中的個體的預測行為和實際行為,並研究它們的優化策略,而最有趣的應用例子則為囚徒困境。囚徒困境為賽局理論當中非零和的最典型例子,僅反映個人最佳選擇而非團體最佳選擇。 -維基百科

古典囚徒困境

警方逮捕甲、乙兩名嫌疑犯,但沒有足夠證據指控二人有罪。於是警方分開囚禁嫌疑犯,分別和二人見面,並向雙方提供以下相同的選擇:

  • 若一人認罪並作證檢控對方(相關術語稱「背叛」對方),而對方保持沉默,此人將即時獲釋,沉默者將判監10年。
  • 若二人都保持沉默(相關術語稱互相「合作」),則二人同樣判監半年。
  • 若二人都互相檢舉(互相「背叛」),則二人同樣判監5年。
圖片參考:http://www.dianliwenmi.com/postimg_1753384.html,並重新繪製。

簡單來說,我方若背叛對方,而對方保持沉默,則這結果對我方最有利,其價值稱為「誘惑」(Temptation,下列僅稱T),若雙方合作,這個結果的價值,對雙方是一樣的,可以稱之為「獎勵」(Reward,下列僅稱R),若對方背叛我方,而我方保持沉默,這個結果對我方最不利,其價值可以稱之為「傻瓜的報酬」(Sucker’s Payoff,下列僅稱S),若雙方背叛,這個結果稱之為「懲罰」(Punishment,下列僅稱P)。

而在這些假設下我們都知道價值大小排序為T>R>S>P,且背叛對方是這場賽局的優勝策略,因為不會輪到自己有傻瓜的報酬。然而,若雙方都選擇這種策略,則會呈現(背叛,背叛)此組合,也就是所謂的納許均衡-即是一個雙方不想單方面改變的結果,此會是個穩定的結果,不是伯瑞多最佳結果的局面,亦是困局。

納許均衡:沒有參賽者願意「單方面」改變策略的策略組合。
伯瑞多最佳結果:參賽者無法「同時」改進的賽局結果。
(出自:林澤民教授網誌,告白的遊戲:紀念約翰‧納許

兩人單邊囚徒困境:以是否信任政治人物為例

此動態賽局裡人民先行動,決定信任與否,而政治人物只在獲得信任後才能行動,決定如何回應人民的信任。這為單邊囚徒困局,其條件是:對人民而言R>0>S;對政治人物而言T>R>0。

人民不信任政治人物,也就是導致(0,0)結果的策略。這是因為人民如果信任政治人物,則政治人物辜負人民信任比承擔人民信任獲利較大(T>R),因此自私的(也就是賽局理論所謂「理性」的)政治人物將會選擇辜負人民。可是人民也看得出來政治人物獲得信任時會辜負人民,而使自己蒙受損失(S<0),因此理性的人民便不會信任政治人物。因為不信任政治人物的理性人民不會單方面改變策略,所以「不信任」是一個納許均衡。(出自:林澤民教授網誌,我們為什麼不信任政治人物?

圖片參考:http://blog.udn.com/nilnimest/36629531,並重新繪製。

囚徒困境之日常生活應用

  1. logrolling:利益交換,像是議會換票或是男女在性關係方面的心態(經典語句:You scratch my back and I’ll scratch yours)。
  2. transaction:綁架時交換人質或間諜。
  3. collective action
  4. the tragedy of the commons: 占據公有物或污染環境。
  5. constant-sum game with a cost for mutual defection:有兩敗俱傷的情況。
  6. mexican standoff:恐怖平衡,Stand-off指的是一種互相對峙、抗衡的僵局。像是電影《少年Pi的奇幻漂流》裡的少年與老虎,在Mexican standoff裡頭 除了無法出手外,更是無法隨心所欲地安全退場或抽身。
  7. cheating in competition:作弊、可口可樂和百事同時殺價(兩敗俱傷、price war)

解決方法

  • 第三者權威存在
  • 信任
  • 若是重複囚徒困境,則採用以牙還牙之策略。此策略有兩個步驟:
  1. 第一個回合選擇合作。
  2. 下一回合是否選合作要看上一回對方是否合作,若對方上一回背叛,此回合我亦背叛;若對方上一回合作,此回合繼續合作。(以牙還牙者個人永遠不會得到最大利益,整個策略以全體的最大利益為依歸)

[註解]

非零和:在不同策略組合下各博弈方的得益之和是不確定的變量,零和博弈表示所有博弈方的利益之和為零或一個常數,即一方有所得,其他方必有所失。在零和博弈中,博弈各方是不合作的。(出自:維基百科