【文思不藏私】囚徒困境與納許均衡

Vince Huang
【文思不藏私】
May 14, 2022

上了經濟學,學到了「囚徒困境與納許均衡」,想用一段簡單的例子,用自己的說明重述一次幫助記憶。

以著名的「囚徒困境」為例。囚犯甲與乙兩人因案被捕,警方分開偵訊。因為證據不夠充分,必須要拿到嫌犯的自白。因此,警方分別告訴囚犯甲與乙。

  • 如果你認罪,但你同夥不認罪,你只要被關一年(圖上計為 -1),但你同夥要被關五年(圖上計為 -5)。
  • 如果你不認罪,而你同夥認罪,你要被關五年(圖上計為 -5),但你同夥只要被關一年(圖上計為 -1)。
  • 如果你們倆都認罪了,你們都要被關三年(圖上計為 -3)。
  • 如果兩人都不認罪,由於證據薄弱,兩人只要被關兩年(圖上計為 -2)。

如果你是「囚犯甲」/「囚犯乙」,你的決定是?

如果我們看到圖中的數字,會發現「最佳方案」應該是兩個人都不要認罪,只要各關兩年(圖上計為 -2)。然而,如果你是囚犯甲,你會怎麼想呢?

  • 囚犯甲想:「如果囚犯乙認罪了,我最好也要認罪,因為我不認罪要關 5年、認罪只要關 3 年」(-3 > -5)
  • 同樣的,囚犯乙想:「如果囚犯甲認罪了,我最好也要認罪,因為我不認罪要關 5年、認罪只要關 3 年」(-3 > -5)

所以「認罪」對雙方分別而言是「最適合的選擇」,我們稱為這時候的策略為「優勢策略」(dominant strategy)。

當某個賽局中的組合是「奈許均衡」(Nash Equilibrium)時,表示任何一個決策者單獨改變自己的策略,並不會使自己的報償(payoff)提高。在囚徒困境中,「甲認罪,乙認罪」就變成這個賽局的「納許均衡」。

--

--

Vince Huang
Vince Huang

Written by Vince Huang

A Product Owner in software company, interests include agile/scrum, machine learning and mobile design. https://www.linkedin.com/in/kuoyuhuang/