囚徒困境與賽局理論

5 min readJan 25, 2017

演講時間：2016/01/04

主講者：林澤民，台大電機系畢業，美國明尼蘇達大學政治學博士，現任教於美國德州大學奧斯汀校區政府系。在泛科學刊登囚徒困境系列。
澤民教授開場即說，德州大學每個系的學生均有寫作課，而他開設的是與賽局理論有關，以英文寫十頁內容，且一學期交三篇文章，文章內容以囚徒困境來應用於電影、故事、日常生活。

賽局理論，考慮遊戲中的個體的預測行為和實際行為，並研究它們的優化策略，而最有趣的應用例子則為囚徒困境。囚徒困境為賽局理論當中非零和的最典型例子，僅反映個人最佳選擇而非團體最佳選擇。－維基百科

古典囚徒困境

警方逮捕甲、乙兩名嫌疑犯，但沒有足夠證據指控二人有罪。於是警方分開囚禁嫌疑犯，分別和二人見面，並向雙方提供以下相同的選擇：

若一人認罪並作證檢控對方（相關術語稱「背叛」對方），而對方保持沉默，此人將即時獲釋，沉默者將判監10年。
若二人都保持沉默（相關術語稱互相「合作」），則二人同樣判監半年。
若二人都互相檢舉（互相「背叛」），則二人同樣判監5年。

圖片參考：http://www.dianliwenmi.com/postimg_1753384.html，並重新繪製。

簡單來說，我方若背叛對方，而對方保持沉默，則這結果對我方最有利，其價值稱為「誘惑」（Temptation，下列僅稱T），若雙方合作，這個結果的價值，對雙方是一樣的，可以稱之為「獎勵」（Reward，下列僅稱R），若對方背叛我方，而我方保持沉默，這個結果對我方最不利，其價值可以稱之為「傻瓜的報酬」（Sucker’s Payoff，下列僅稱S），若雙方背叛，這個結果稱之為「懲罰」（Punishment，下列僅稱P）。

而在這些假設下我們都知道價值大小排序為T>R>S>P，且背叛對方是這場賽局的優勝策略，因為不會輪到自己有傻瓜的報酬。然而，若雙方都選擇這種策略，則會呈現（背叛，背叛）此組合，也就是所謂的納許均衡－即是一個雙方不想單方面改變的結果，此會是個穩定的結果，不是伯瑞多最佳結果的局面，亦是困局。

納許均衡：沒有參賽者願意「單方面」改變策略的策略組合。
伯瑞多最佳結果：參賽者無法「同時」改進的賽局結果。
（出自：林澤民教授網誌，告白的遊戲：紀念約翰‧納許）

兩人單邊囚徒困境：以是否信任政治人物為例

此動態賽局裡人民先行動，決定信任與否，而政治人物只在獲得信任後才能行動，決定如何回應人民的信任。這為單邊囚徒困局，其條件是：對人民而言R>0>S；對政治人物而言T>R>0。

人民不信任政治人物，也就是導致（0,0）結果的策略。這是因為人民如果信任政治人物，則政治人物辜負人民信任比承擔人民信任獲利較大（T>R），因此自私的（也就是賽局理論所謂「理性」的）政治人物將會選擇辜負人民。可是人民也看得出來政治人物獲得信任時會辜負人民，而使自己蒙受損失（S<0），因此理性的人民便不會信任政治人物。因為不信任政治人物的理性人民不會單方面改變策略，所以「不信任」是一個納許均衡。（出自：林澤民教授網誌，我們為什麼不信任政治人物？）

圖片參考：http://blog.udn.com/nilnimest/36629531，並重新繪製。

囚徒困境之日常生活應用

logrolling：利益交換，像是議會換票或是男女在性關係方面的心態（經典語句：You scratch my back and I’ll scratch yours）。
transaction：綁架時交換人質或間諜。
collective action
the tragedy of the commons：占據公有物或污染環境。
constant-sum game with a cost for mutual defection：有兩敗俱傷的情況。
mexican standoff：恐怖平衡，Stand-off指的是一種互相對峙、抗衡的僵局。像是電影《少年Pi的奇幻漂流》裡的少年與老虎，在Mexican standoff裡頭除了無法出手外，更是無法隨心所欲地安全退場或抽身。
cheating in competition：作弊、可口可樂和百事同時殺價(兩敗俱傷、price war)

解決方法

第三者權威存在
信任
若是重複囚徒困境，則採用以牙還牙之策略。此策略有兩個步驟：

第一個回合選擇合作。
下一回合是否選合作要看上一回對方是否合作，若對方上一回背叛，此回合我亦背叛；若對方上一回合作，此回合繼續合作。（以牙還牙者個人永遠不會得到最大利益，整個策略以全體的最大利益為依歸）

［註解］

非零和：在不同策略組合下各博弈方的得益之和是不確定的變量，零和博弈表示所有博弈方的利益之和為零或一個常數，即一方有所得，其他方必有所失。在零和博弈中，博弈各方是不合作的。（出自：維基百科）

如果你喜歡我的文章可以做以下兩件事情：
1. 拍拍手3下。
2. 更喜歡甚至想催促我寫其他文章，拍手3下以上有任何回饋或想看的文章也歡迎留言分享 :)

囚徒困境與賽局理論

古典囚徒困境

兩人單邊囚徒困境：以是否信任政治人物為例

囚徒困境之日常生活應用

解決方法

Written by Irene Chuang