게임이론 입문

8 min readSep 5, 2018

원본 : https://towardsdatascience.com/introduction-to-game-theory-part-1-1a812d898e84을 블록체인/암호화폐에 대한 이해를 돕고자 번역한 내용입니다.

크립토이코노믹스(Crypto-Economics)란?

2009년, 사토시 나카모토는 컴퓨터에 인센티브를 부여하기 위해 비트코인을 만들었습니다. 2018년, 우리는 인간에게 동일한 방식으로 인센티브를 부여하여 수십억 달러에 달하는 블록체인 프로젝트를 만들고 있습니다. 이러한 수많은 각각의 블록체인 프로젝트가 추구하는 생태계 모델들을 크립토이코노믹스(Crypto-Economics)라고 할 수 있습니다.

행동경제학이란?

우선 한 줄로 요악하면, 지혜로운 인간과 효율적으로 움직이는 시장을 통해 항상 합리적인 결과를 도출하는 것의 부정에서 시작한 경제학의 한 분야입니다.

행동경제학은 인간의 실제 행동을 심리학, 사회학, 생리학적 견지에서 바라보고 그로 인한 결과를 규명하려고 합니다. 행동경제학은 주류경제학의 ‘합리적인 인간’을 부정하는 데서 시작하지만, 그렇다고 인간을 비합리적 존재로 단정 짓는 것은 아닙니다. 다만 온전히 합리적이라는 주장을 부정하고, 이를 증명하려는 것이 행동경제학의 입장입니다. 경제적 주체들이 제한적으로 합리적이며 때론 감정적으로 선택하는 경향이 있다고 주장하기도 합니다.

앞서 언급한 블록체인 프로젝트들의 크립토이코노믹스, 즉 생태계를 구성하는 인센티브들은 대개 행동경제학을 기반으로 이루어집니다.

게임이론이란?

그렇다면 게임이론이란 무엇일까요?

블록체인에서 사용되는 행동경제학에는 여러가지 이론들이 있습니다. 메커니즘 디자인(Mechanism Design), 거버넌스(Governance), 게임이론(Game Theory) 등. 오늘은 먼저 게임이론에 대해서 알아보겠습니다.

게임이론은 폰 노이만(John von Newmann)과 모르겐슈테른(Oskar Morgenstern)이 1944년에 공저한 [게임이론과 경제 행태(Theory of Games and Economic Behavior)]가 발간되면서 본격적으로 발전되기 시작했습니다. 이들은 두 경기자 사이의 제로섬 게임(Zero-Sum Game)을 연구하면서 제로섬 게임의 본질이 게임 참가자가 서로 경쟁하고 그 결과 한 사람의 이득이 다른 사람의 손실로 귀착되는 현상과 같은 적대적 게임임을 발견했습니다.

대표적 제로섬 게임으로는 포커, 동전 던지기, 홀짝게임 등을 들 수 있고, 탁구나 야구 같은 스포츠나 전쟁도 적대적 게임의 하나로 간주할 수 있습니다. 따라서 제로섬 게임은 경제학과 군사학에 큰 영향을 주었다고 할 수 있습니다.

실질적으로 게임이론이 발전하게 된 계기는 1994년 게임이론으로 노벨 경제학상을 공동 수상한 존 내쉬(JohnNash)에 의해 마련되었습니다. 게임이론 자체는 응용 수학의 한 분야로 발전되었지만 게임이론은 경제학에서의 여러 가지 문제, 특히 과점 시장의 문제를 분석하는 틀로 도입되기 시작했습니다. 그 이후 게임이론은 미시경제학에서는 필수 불가결한 분석 도구로 자리 잡고 있습니다.

ㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡ

Introduction To Game Theory

Simultaneous Game(동시다발적인 게임)

게임이론에서 주요 유형의 게임 중 하나는 Simultaneous Game(동시다발적인 게임)이다. Simultaneous Game(동시다발적인 게임)은 참가자들이 동시다발적으로 행동하는 게임이다.(그렇지 않다면, 후발 참여자는 초기 참여자의 행동을 알지 못하여 효과적으로 동시다발적인 게임으로 만들 수 있다.) 순차적인 게임들은 대개 일반적인 형태로 표시되고, 각 참가자들에 대해 보상을 포함하는 2-Tuple(튜플)로 이루어진 N x N 매트릭스로 구성된다.

이것을 설명하기 위해서, 위의 예를 생각해보자. 이러한 순차적인 게임은 Prisoner’s Dilemma(죄수의 딜레마)라고 불리며, 각 죄수는 형벌을 줄이기 위해(자백) 다른 죄수를 배신할 수 있으며, 다른 죄수도 보호하고 다른 죄수도 그렇게 해주기(거짓말)를 원할 수 있다. 매트릭스의 각 셀에서, Tuple(튜플)의 첫 번째 요소는 죄수 1에 대한 보상을 나타내고 두 번째 요소는 죄수 2에 대한 보상을 나타낸다. 먼저 각 참가자가 할 선택 사항(자백 or 거짓말)을 확인하고 해당 행과 열에 상응하는 매트릭스를 찾음으로써 매트릭스를 읽을 수 있는 것이다. 예를 들어, 만약 죄수 1이 자백을 선택하고 죄수 2가 거짓말을 선택한다면, 당신은 첫 번째 행과 두 번째 열의 매트릭스를 읽어, 죄수 1에게는 0의 보상을 죄수 2에게는 -10의 보상을 줄 수 있다.

Simultaneous Game(동시다발적인 게임)에서, 각 참가자들은 다른 참가자들이 어떻게 행동할 것이라고 가정을 해서 결정을 해야 한다. 게임이론에서, 우리는 참가자들이 그들의 보상을 최대로 만들어주는 합리적인 의사결정자일 것이라고 예상한다. 게임의 결과를 예상하는 한가지 방법은 각 참가자들의 유리한 전략들을 밝혀내는 것이다. 유리한 전략은 다른 참가자의 선택에 관계없이 주어진 참가자에게 가장 좋은 전략이다. 즉, 죄수 2의 행동과는 상관없이, 죄수 1의 유리한 전략은 죄수 1을 위한 최적의 전략인 것이다.

Prisoner’s Dilemma(죄수의 딜레마)게임에서, 우리는 양쪽 참가자들에게 가장 유리한 전략이 자백이라는 것을 알 수 있다. 먼저, 이 매트릭스가 대칭이므로, 각 참가자들은 각 선택에 대해 동일한 보상을 받는다. 이것은 유리한 전략을 알아낼 때, 다른 참가자들에게도 유리한 전략일 수 있는 한 참가자의 유리한 전략을 고려하면 된다는 것을 의미한다. 이제, 죄수 1의(그리고 죄수 2의) 유리한 전략을 찾아보자. 우리는 죄수 2가 행할 수 있는 선택들 중에서 죄수 1의 최선의 선택을 찾아야 한다. 만약 죄수 2가 자백하기로 결정했다면, 죄수 1은 자백함으로써 -8의 보상을 받거나 거짓말함으로써 -10의 보상을 받는다. 따라서, 죄수 1은 자백할 것이다. 만약 죄수 2가 거짓말을 한다면, 죄수 1은 자백함으로써 0의 보상을 얻거나 거짓말함으로써 -1의 보상을 얻을 수 있다. 따라서, 그는 또 자백을 선택할 것이다. 결국, 죄수 1은 죄수 2의 선택에 상관없이 항상 자백하는 유리한 전략을 선택할 것이다. 즉, 자백이 죄수 1의 가장 최적화된 선택이라는 것이다. 이러한 분석은 죄수 2의 유리한 전략에도 동일하게 적용된다. 결론적으로, Prisoner’s Dilemma(죄수의 딜레마)게임에서, 양쪽 죄수들은 궁극적으로 자백을 선택할 것이다.

양쪽 전부 자백하는 선택이 바로 Nash Equilibrium(내쉬 균형)이다. Nash Equilibrium(내쉬 균형)은 어떤 참가자도 그들의 선택을 바꿈으로써 얻을 수 있는 것이 없는 일련의 선택들이다. 자백이 양쪽 죄수들을 위해 가장 유리한 전략임을 밝혀온 이래로, 우리는 어떤 참가자도 선택을 바꾸는 것으로 아무것도 얻을 수 없다는 것을 이미 알고 있다. 결국, 각 참가자가 그들의 유리한 전략을 선택할 때, 일련의 선택들이 Nash Equilibrium(내쉬 균형)이라는 것이다.

Prisoner’s Dilemma(죄수의 딜레마)게임은 합리적인 의사결정자들이 양쪽 죄수들에게 더 나은 보상(양쪽 다 거짓말)을 지급할 수 있음에도 불구하고 서로 협력하지 않기로 선택하는 상황의 예시이다. 그들 각자의 유리한 전략을 선택하는 이런 비협력적인 게임에서, 양쪽 죄수들은 실제로 최적의 결정을 만드는데 실패한다. 개인의 합리적인 전략은 사회적, 국가적으로 최적화된 전략과 충돌한다. 일반적으로, Prisoner’s Dilemma(죄수의 딜레마)게임과 같은 Simultaneous Game(동시다발적인 게임)은 갈등과 협력에 대한 연구를 할 수 있는 정형화된 방법들을 제시해준다. 또한, 협력의 부재를 보여주는 이 특정한 시나리오는 정치, 경제, 생물학과 같은 몇몇의 분야에서 볼 수 있다. 이런 예시들은 현실에서 ‘최적의’ 선택이 협력이더라도, 합리적인 참가자들은 전부 다른 참가자들과 협력하는 것을 믿을 수 없기 때문에 협력하지 않는 것을 선택한다고 말한다.