정보의 확산(Diffusion)과 군집 행동 (Herding) — Computing herding behavior with the Bayes Rule

13 min readJun 11, 2019

정보는 네트워크를 통해 확산된다. 전염병처럼 노드에서 노드로 옮겨 가는 모습을 cascading behavior, 혹은 diffusion of innovation 이라고 일컫는다. 네트워크를 통해서 정보가 확산되는 예시는 매우 다양하다. 뉴스나 언론보도의 여론형성 혹은 가짜뉴스를 통한 루머형성, 입소문 마케팅, 인터넷을 통해 확산되는 캠페인 등이 모두 정보 확산의 예시이다.

확산 (Diffusion) 을 모델링 하는 방법은 크게 두 가지가 있다: Decision based model 과 Probabilistic model 이다.

정보의 수용에 개인의 판단이 개입한 경우에는 decision based model 을 사용한다. 주로 기술이나 제품의 수용, 혹은 의사결정을 모델링하는 데 쓰인다. 노드는 이웃들의 결정을 관찰하고 자신의 의사결정에 이를 반영한다. 다른 사람들이 어떤 메신저, 어떤 sns를 쓰는지를 보고 자신도 같은 것으로 옮기는 현상도 decision based model 로 나타낼 수 있다.

Decision based model 은 개인이 자신에게 돌아오는 payoff 를 고려해서 결정을 하기 떄문에 utility-based 이고 deterministic 하다. 그리고 개인이 주변의 노드들의 결정을 보고 판단을 내리기 때문에 ‘node centric’ 하다고 할 수 있다.

Probabilistic model 은 개인의 결정이나 판단이 들어가지 않은 채 확률로만 결정이 된다. 주로 전염병을 모델링할 때 쓰인다. 병에 걸릴 확률은 말 그대로 확률이지, 개인이 결정을 내리거나 판단을 하는 일이 아니다. 감염된 노드는 contagion 을 다른 (uninfected) 노드로 옮기려고 한다.

Decision based model 에는 크게 Herding 과 Collective Action 이 있다. Herding 은 앞 순서를 보고 나의 행동을 결정하는 순차적인 (sequential) 의사결정 의 상황을 가리킨다.

예를 들어, 낯선 도시에서 저녁식사를 할 식당을 고를 때 Yelp 를 보고 식당 A를 방문했다고 하자. 하지만 막상 식당에 도착하니 A 가게는 텅 비어있는 반면 옆 가게 B는 손님들로 차있다. 아마 대부분의 사람들은 손님이 더 많은 옆 가게로 옮겨서 식사를 할 것이다. 이처럼, 다른 사람들의 결정을 통해서 유추한 정보가 개인이 가지고 있는 정보보다 더 강력하게 작용할 수 있고 이런 정보를 의사결정 과정에 반영하는 것을 가리켜 Herding 이라고 한다.

Collective Action은 1978년 Grenovetter 에 의해 제시된 개념으로, 사람들이 다른 모든 사람들의 행동을 볼 수 있다고 가정한 모델이다 (complete graph 를 가정한다). 앞서 herding 의 상황이 순차적인 의사결정이었다면 collective action 은 순서보다는 정보의 가시성 과 관련이 깊다.
연극을 보고 사람들이 기립박수를 치거나 공연 도중에 우루루 이탈하는 상황, 주식시장에서 주식을 사거나 파는 상황, 폭동이나 시위가 일어나는 상황이 collective action 의 예시가 될 수 있다.

Herding 모델은 다음과 같은 구조를 가진다.

- 순차적인 의사결정 상황이다.
- 개인은 의사결정을 돕는 개인적인 정보 (private information) 를 가지고 있다.
- 다른 사람의 private information 을 관찰할 수 없지만, 그들의 행동은 관찰할 수 있다 (그리고 행동을 통해 private information 을 추측할 수 있다)

Herding 은 비이성적으로 보이지만, 모든 사람들이 이성적으로 판단을 하더라도 발생할 수 있는 현상이다. 심지어 non-optimal 한 결과를 나을 수도 있다. Herding 은 적절한 구조를 갖출 경우 쉽게 발생할 수 있지만, 한번 룰을 깨면 동요가 쉽게 온다.

간단한 Herding 상황을 아래와 같이 나타낼 수 있다.

바구니에 세 개의 구슬이 들어있다고 치자. 상황은 두 가지이다:

majority-blue: 2 blue, 1 red
majority-red: 1 blue, 2 red

사람들은 바구니가 majority-blue 인지, majority-red 인지 맞추려고 한다. 한 사람씩 바구니에서 구슬을 하나씩 꺼낸 뒤에, 꺼낸 구슬의 색을 자신만 보고 바구니가 majority-blue 인지 majority-red 인지 공개적으로 추측을 한다. 뒷 사람들은 앞 사람이 꺼낸 구슬의 색을 모르지만, 그 사람이 어떤 추측을 했는지는 알 수 있다.

이 상황에서 사람들의 행동을 일반화 해볼 수 있다.

1st person: 자신이 꺼낸 색의 구슬
2nd person: 자신이 꺼낸 색의 구슬
1st person 과 같은 색일 경우, go with it
1st person 과 다른 색일 경우, go with your own color
3rd person:
이전 두 사람의 추측이 달랐다면, go with your color
두 사람의 추측이 같다면, 자신의 색과 상관없이 앞 사람들의 결정을 따른다.
4th person:
1st person, 2nd person 의 추측이 같다면 이들의 결정을 따른다. 이 때, 3rd person 의 추측은 아무런 정보를 가지지 않는다 (conveys no information).
만약 앞 세 사람의 추측이 1 대 2 라면 go with your color.

즉, |blue-red| 가 2 이상이라면 cascade 가 일어나서 나머지 사람들의 의견이 다수가 추측한 색으로 통합이 된다.

아래는 Herding 의 간단한 실험 설계이다. Herding 모델은 베이지안 규칙으로 계산할 수 있다.

가정: 다음과 같으면 Blue 를 선택하는 것이 좋다.

실험 설계

Blue 하나를 뽑았을 때:

이번에는 연속적인 상황을 가정행보자. 앞 사람들이 Blue, Blue, Red 를 뽑았을 때 다음 사람은 어떤 결정을 내릴 수 있을까?

앞 사람들이 Blue, Blue, Red 를 뽑았을 때 바구니가 majority-blue 일 확률은 2/3, majority-red 일 확률은 1/3 이므로 개인적인 signal 과 상관없이 majority-blue 를 선택하는 것이 좋을 것이다.

이 외에도 State, Signal, 그리고 Payoff 의 개념이 있다.

State 는 사람들이 알고자 하는 실제 상황이다. 즉 Good (good idea), Bad (bad idea) 중에 하나이다. 위의 예시에서는 실제로 바구니가 Majority-blue 인지 Majority-red 인지 상태가 state 일 것이다.

Signal 은 결정을 하기 전에 개인에게 주어지는 신호이다. 완벽한 정보는 아니지만 의사결정을 할 때 유용하다. High signal 은 accepting 이 good idea 라는 것을 의미하고, low signal 은 accepting 이 bad idea 라는 것을 의미한다.

Payoff 는 accept 를 할 때 받게 되는 긍정적이거나 부정적인 보상이다. 결정을 내리기 이전에는 accepting 이 good idea 인지 bad idea 인지 모르며, reject 를 하면 payoff 는 0 이다.

아래는 다양한 가정을 했을 때 Herding 의 상황이다.

직전 사람의 action 만을 안다고 가정할 때, information cascade 가 일어나는가?

첫 번째 사람과 두 번째 사람의 선택은 일반적인 information cascade 가 일어나는 상황과 다르지 않다. 첫 번째 사람은 자신이 받은 signal 만을, 두 번째 사람은 첫 번째 사람의 action 과 자신이 받은 signal 을 바탕으로 판단하므로 기존 상태와 변함이 없다.
세 번째 사람은 두 번째 사람의 action 을 관찰할 수 있지만, 첫 번째 사람의 action 을 볼 수 없다. 두 번째 사람의 action 은 첫 번째 사람의 action 과 관계 없이 자신이 받은 signal 을 따라가므로 세 번째 사람은 두 번째 사람의 action 에서 두 번째 사람의 signal 을 알 수 있다. 그러나 첫 번째 사람의 signal 에 관한 정보는 알 수가 없다.
세 번째 사람이 high signal 을 받고 두 번째 사람이 accept 했다는 사실을 안다면 자신도 정보를 accept 할 것이다. 하지만 세 번째 사람이 low signal 을 받으면 두 번째 사람이 accept 했다는 사실을 안다고 해도 자신의 signal 을 따를 것이다.
이런 세상에서는 information cascade 가 일어나지 않는다. 직전의 선택과 관계 없이 자신의 signal 을 따라 선택하게 되기 때문이다.

새로운 기술에 대해 받아들이거나 거부하는 결정을 순서대로(sequentially) 할 수 있다고 하자. 기술을 받아들이는 사람은 긍정적이거나 부정적인 payoff 를 받는다. 기술이 좋은 기술일 경우에 payoff 는 긍정적이고, 안 좋은 기술일 경우에 payoff 는 부정적이다. 기술을 거부하는 사람은 payoff 가 항상 0이다.

사람들은 기술에 대한 개인적인 signal 을 받고, 이전 사람들이 취한 action 을 관측할 수 있다. 여기에 더해 이전 사람들이 취한 action 에 대한 payoff 까지 다음 사람이 알 수 있다고 가정한다.

신기술이 안 좋은 기술일 경우에는, 이전 사람들이 모두 adopt 를 하더라도 payoff 의 평균이 음수일 가능성이 높으므로 다음에 선택할 사람은 기술을 reject 할 가능성이 높다. 사람들의 payoff 를 알게 되면 좋지 않은 기술일 경우에 이를 받아들이는 것에 대한 cascade 는 발생하기가 어렵다.
신기술이 좋은 기술일 경우에는, payoff 의 평균이 양일 가능성이 높으므로 시간이 지날수록 사람들이 adopt 할 가능성이 높아진다. Reject 에 대한 cascading 은 일어나기 어렵다. 단, 확률적으로 초기 선택자가 adopt 한 후에 음의 payoff 를 경험한 경우에는 이후에 reject 에 대한 cascading 이 발생할 수도 있다.

이번에는 signal 과 action 에 대한 확률이 있다고 가정한다.

Accept 가 Good idea 일 확률은 p, Bad idea일 확률은 1-p. 기술이 실제로 Good일 때 High signal 을 받을 확률은 q, Low signal 을 받을 확률은 1-q.

Accept 가 Good idea 일 (편의상, Good technology 라고 칭한다.) 확률은 p = 1/2 이고, good technology 일 때 high signal 을 받을 확률은 q = 3/4 이다. 그리고 실제로 기술이 good technology 인 상황을 가정해보자.
즉, Pr(Good technology) = 1/2 이고 Pr(High signal | Good technology) = 3/4 이다. 베이지안 추론으로 다음과 같이 상황을 예측해 볼 수 있다.

기술이 good technology 라고 가정한 상태이다. 첫 번째 사람은 High signal 을 받으면 기술을 accept 할 것이다. 따라서 Pr(High signal | Good technology) = 3/4 가 accept 할 확률이다.
반면, Low signal 을 받으면 기술을 reject 할 것이다. 따라서 Pr(Low signal | Good technology) = 1/4 가 reject 할 확률이다.
첫 번째 사람과 두 번째 사람이 어떤 결정을 내릴지 살펴보자. 첫 번째, 두 번째 사람은 본인의 signal 을 따르기 때문에 이 경우에 첫 번째 사람과 두 번째 사람의 결정은 독립사건이라고 생각할 수 있다. 따라서 둘 모두 accept 할 확률은 3/4 * 3/4 = 9/16. 한 명만 accept 할 확률은 3/4 * 1/4 = 3/16. 두 명 모두 reject 할 확률은 1/4 * 1/4 = 1/16 이 된다.
세 번째 사람은 첫 번째, 두 번째 사람의 action 이 일치할 경우에 자신의 signal 과 상관없이 앞 두 사람의 action 을 따르게 되고, information cascade 가 일어나기 시작한다. 위와 같은 상황에서 세 번째 사람부터 cascade 가 발생할 확률은 Pr(Accept, Accept) + Pr(Reject, Reject) = 9/16 + 1/16 = 5/8 이다.

이번에도 signal 과 action 이 발생할 확률을 가정해보자.

Good technology 일 확률 p = 1/2, Good technology 일 때 High signal 을 받을 확률 q = 2/3 이다. 이에 더해, 모든 사람은 이전 사람들의 action 을 알 수 있지만 signal 은 알 수 없다고 하자. 열 번째 사람. 그리고 이전 모든 사람들이 기술을 reject 하여서 Reject cascade 인 상황을 가정하자.

Reject cascade 가 발생할 확률을 살펴보자. 첫 번째, 두 번째 사람은 본인이 받은 signal 에 따라 행동을 취한다. 첫 두 명이 reject 를 하면 그 이후 사람들은 본인의 signal 과 관계 없이 기술을 reject 하게 된다.
실제로 Good technology 인 상황이므로 Pr(Low signal | Good technology) 가 각자가 기술을 reject 할 확률이다. 주어진 상황에서 이는 1– q = 1/3 이므로, 1/3 * 1/3 = 1/9 가 reject cascade 가 일어날 확률이다.
만약에 열 번째 사람이 결정을 내리기 전에 아홉 번째 사람의 signal 에 대해 알게 되었다고 가정하자. 아홉 번째 사람은 high signal 을 받았다면 열 번째 사람은 어떤 결정을 내리게 될까?
이 상황에서 알 수 있는 것은
첫 번째 signal = low
두 번째 signal = low
아홉 번째 signal = high
라는 사실이다. 열 번째 사람은 자신이 받은 signal 대로 행동할 것이다.
열한 번째 사람은 자신의 signal 과 이전 사람들의 action 에 대해서만 알고 있다. 열한 번째 사람은 열 번째 사람이 아홉 번째 사람의 signal 을 안다는 사실만 알고 이 signal 이 무엇인지에 대해서는 알지 못한다. 첫 아홉 명이 reject 했다.
열 번째 사람이 reject 하면 열한 번째 사람은 본인의 signal 과 상관없이 다수를 따라서 기술을 reject 할 것이다. 열한 번째 사람은 {#1: low, #2: low, #9: ?, #10: low} 라는 사실을 알게 되고, 네 개 signal 중 세 개 이상이 low signal 이기 때문이다.
열 번째 사람이 기술을 accept 하면 열한 번째 사람은 {#1: low, #2: low, #9: high, #10: high} 라는 사실을 알게 되고, 본인이 받은 signal 대로 action 을 취할 것이다.

정보의 확산(Diffusion)과 군집 행동 (Herding) — Computing herding behavior with the Bayes Rule

직전 사람의 action 만을 안다고 가정할 때, information cascade 가 일어나는가?

이번에는 signal 과 action 에 대한 확률이 있다고 가정한다.

이번에도 signal 과 action 이 발생할 확률을 가정해보자.

Written by kiana