블록체인 탈중앙성에 대한 정량적 접근

Jaeseung Lee
Decipher Media |디사이퍼 미디어
10 min readSep 23, 2021

해당 글은 2020년 후반기에 진행된 탈중앙성과 관련 연구와 이에 대한 출판물인 “DQ: Two approaches to measure the degree of decentralization of blockchain”을 기반으로 작성되었습니다.

이재승 — Decipher Senior Researcher
이병헌 — Decipher Senior Researcher, President of Decipher
정재영 — Decipher Senior Researcher
심호준 — Decipher Senior Researcher

Introduction

블록체인에서 가장 많이 언급되는 단어 중 하나가 바로 ‘탈중앙성’입니다. 이를 간단히 정의해보면 ‘어떤 네트워크 내에서 일어나는 사건에 대한 사실과 이와 관련된 합의가 얼마나 다수에게 분산되어 있는가?’라고 볼 수 있습니다. 최근 활발하게 거래가 이루어지고 있는 DeFi(Decentralized Finance)의 경우도 결국 이러한 블록체인 자체의 탈중앙성 성질을 활용한 어플리케이션의 일종이라고 볼 수 있습니다.

탈중앙성에 대한 가장 유명한 글 중 하나는 비탈릭 부테린이 작성한 The Meaning of Decentralization입니다. 해당 글에서는 총 3가지로 탈중앙화를 분류합니다.

첫번째는 구조적 탈중앙화입니다. 이것은 실제 몇 대의 컴퓨터가 하나의 시스템을 구축하고 있는가를 의미합니다. 좀 더 풀어서 말하면 해당 시스템이 돌아가기 위해서는 몇 대의 컴퓨터가 고장나는 것 까지 견더낼 수 있는가를 의미합니다. 간단한 서버-클라이언트 구조를 상상해보면 어떠한 프록시 서버나 기타 아카이브 서버가 없다고 가정할 때 해당 중앙 서버가 고장나는 순간 사용자는 해당 서비스를 이용할 수 없습니다. 따라서 이것은 단일 장애점 문제를 유발하고 서비스의 가용성이 낮다고 볼 수 있습니다.

두번째는 정치적 탈중앙화입니다. 이것은 몇 명의 주체가 해당 시스템을 통제하는가를 의미합니다. 극단적인 정치적 중앙화의 예는 어떤 서비스를 운영하는 회사의 결정권이 CEO 1명에게 집중되어 있는 것을 들 수 있습니다.

세번째는 논리적 탈중앙화입니다. 이것은 해당 시스템이 하나의 획일적인 구조로 존재하는지 아니면 분리되도 각각 정상적으로 운용될 수 있는가를 의미합니다. 예를 들어 카카오톡에서 대한민국 외부로 나가게 중계해주는 서버(혹은 라우터 등)가 고장나도 대한민국 내부 사람들끼리 서로 문제없이 문자를 주고 받을 수 있다면 이것은 해당 수준의 논리적 탈중앙화가 진행되었다고 말할 수 있습니다.

아래 그림은 비탈릭 부테린 포스트에 인용된 그림인데 각각의 탈중앙화 개념이 복잡하게 얽혀있음을 확인할 수 있습니다.

다만, 비탈릭 부테린이 정의한 탈중앙화 개념은 네트워크 구조, 합의 과정에 국한되어 있고 실질적인 인덱스가 존재하기보다는 철학적이고 추상적으로 접근하였기 때문에 실제 적용하기가 쉽지 않습니다. 따라서 정량화된 탈중앙성 지수를 설계함으로써 사용자 입장에서는 알기 쉽게 정량적으로 수치화하여 본인의 기호에 맞는 플랫폼을 선택할 수 있고 개발자 입장에서는 본인의 플랫폼이 현재 얼마나 중앙화되었는지 검증해볼 수 있는 지표로 활용할 수 있습니다.

Design of Decentralization Quotient (DQ)

앞서 언급한 대로 탈중앙성을 수치화하기 위한 팩터는 무수히 많이 존재합니다. 하지만 문제를 최대한 단순화하면서도 직관적으로 풀기 위해 `검열 저항성`과 `지역 다양성` 측면에서 정량화를 진행했습니다. 이 밖에도 특정 클라이언트 프로그램의 점유율(e.g. bitcoin core, geth), 특정 클라이언트 프로그램에 커밋하는 개발자 분산 정도 등 여러 가지 팩터를 생각했었지만, 해당 사항은 오픈소스 커뮤니티 안에서 지속해서 감시가 이루어지고 있고 문제가 감지될 때 이슈 제안 등을 통해 즉각적으로 피드백 반영을 요청 가능, 사용자가 스스로 어떠한 클라이언트를 사용할지 제한 없이 선택 가능 등 앞서 언급한 두 가지 측면보다 불가항력적인 요소가 적다고 판단하여 배제하였습니다.

아래 테이블은 앞으로 나올 수식에 대한 기호 설명입니다.

1) Censorship Resistance

검열 저항성 측면에서 탈중앙성을 논의하기 위해서는 먼저 검열에 대한 정의를 명확히 하는 것이 필요합니다. 검열이란 출판, 보도, 발표 등을 임의로 통제하는 일을 말합니다. 최근 대표적인 예로는 페이스북이 COVID-19 관련 진행한 게시물 필터링을 들 수 있습니다. 이를 블록체인의 관점에서 바라보면 검열 저항성은 내가 보낸 트랜잭션이 채굴자에 의해 블록 안에 의도적으로 포함되지 않거나 혹은 늦게 포함되지 않을 확률입니다. 블록체인에서 블록 생성조건은 각각의 합의 알고리즘마다 달라지기 때문에 이를 나눠서 생각할 것입니다. 본문에서는 가장 많이 사용되는 합의 알고리즘인 Proof-of-Work(Pow)와 Proof-of-Stake(PoS) 관점에서 검열 저항성 탈중앙성 지수를 논하겠습니다. Delegated Proof-of-Stake(DPoS)는 성능을 위해 의도적으로 탈중앙성을 훼손한 케이스이기 때문에 지수 산정 시 제외하였습니다. Proof-of-Authority(PoA)나 PBFT+DPoS 변형인 Tendermint도 비슷한 이유로 배제하였고 Paxos의 경우에는 BFT 모델이 아니기 때문에 역시 배제하였습니다.

지금부터 우선, PoW 관점에서 검열 저항성 탈중앙화 지수를 어떻게 산정해볼 수 있을지 살펴보겠습니다. PoW는 주어진 해시 퍼즐을 가장 먼저 풀어내는 사람이 블록을 생성할 권한을 갖습니다. 비트코인을 기준으로 설명하면 nonce 값을 바꾸면서 해당 블록 채굴을 위해 요구되는 해시값을 찾을 때까지 이 과정을 반복합니다. 이때 사용되는 컴퓨팅 리소스를 해시파워라 정의하고 이 해시파워를 얼마나 보유하냐에 따라 확률적으로 얼마나 블록 생성이 가능한지 추정할 수 있습니다. 따라서 블록체인 네트워크에 참여하는 전체 노드를 모집단으로 보고 이를 [0 1] 정규화를 진행했을 때 해당 값을 x축으로 보유한 해시파워를 y축으로 하여 누적 분포 함수를 그릴 수 있습니다. 해시파워가 모든 노드에서 동등한 상황을 균등 분포로 보면 해당 분포에 대한 상대적 비율을 계산할 수 있고 이를 수식으로 나타내면 아래와 같습니다.

다음은 PoS 관점에서 검열 저항성 탈중앙화 지수를 어떻게 산정해볼 수 있을지 살펴보겠습니다. PoS는 프로토콜 별로 상이하긴 하지만 일반적으로 보유한 지분(토큰)에 비례하여 확률적으로 블록생성 권한을 가집니다. 이에 더하여 다른 노드들의 경우 본인의 토큰을 활용하여 어떤 블록이 올바른지 투표하여 해당 블록이 생성될 수 있게 합니다. 따라서 x축은 PoW에서처럼 동일하게 설정하고 y축을 토큰 보유량으로 설정하여 누적 분포 함수를 그릴 수 있습니다. 이를 수식으로 나타내면 아래와 같습니다.

위 수식들을 기반으로 가장 대표적인 메인넷인 비트코인과 이더리움에 대해서 계산했을 때 비트코인은 0.0110, 이더리움은 0.0108이 나오는 것을 확인할 수 있습니다. 물론 P2P 네트워크이기 때문에 모든 노드가 전부 트랙킹되었다고 확신할 수 없지만 최근 트랜잭션이 발생하는 대부분의 노드를 산정한 수치입니다. 좀 더 쉽게 알 수 있게 그래프로 가시화하면 아래와 같습니다.

두 메인넷 모두 극단적인 리소스 집중 현상이 발생하고 있는 것을 알 수 있는데 이는 PoW 구조에 기반한 마이닝 풀의 존재로 인한 것입니다. 2021년 9월 기준으로 F2Pool(18.9 %), AntPool(16.1 %) 등 소수의 마이닝 풀이 다량의 해시파워를 점유하고 있는 상태입니다. (비트코인은 16개의 마이닝 풀, 이더리움은 17개의 마이닝 풀이 99 %의 해시파워를 점유) 따라서 차후 PoW를 합의 알고리즘으로 지속해서 가져갈 생각이라면 이러한 부분에 대한 깊은 고찰이 필요하다고 볼 수 있습니다.

2) Geographical Diversity

검열 저항성에 이어 살펴볼 부분은 지역 다양성입니다. 비트코인 채굴의 절반 이상을 담당하고 있던 중국에서 정부에 의해 채굴이 금지된다던가 같은 국가별 블록체인에 대한 다양한 규제가 이루어지고 있습니다. 따라서 특정 메인넷의 노드가 특정 국가에 집중되게 되면 그 메인넷의 가용성은 떨어지게 되고 심할 경우 거버넌스 자체가 외부 압력에 의해 왜곡될 수 있습니다. 따라서 이러한 부분을 정량화하기 위해 활성화된 노드가 얼마나 많은 국가에 퍼져있는지에 따라 이를 상대적 수치로 환산하여 계산하였습니다. 또한, 선형적인 그래프가 아닌 초기에는 하나의 국가가 추가될수록 영향이 커지고 참여한 국가 풀이 넓어짐에 따라 이에 대한 영향이 비선형적으로 감소하도록 로그함수를 활용하였고 각 국가별 노드 수의 영향력도 반영하기 위해 이를 가중치 계수로 주었습니다. 이를 수식으로 나타내면 아래와 같습니다.

해당 수식을 기반으로 비트코인, 이더리움에 대하여 계산한 값과 choropleth map으로 나타낸 그림은 아래와 같습니다.

처음 논의한 검열저항성 측면에서 바라봤을 때보다 탈중앙화 정도가 높음을 알 수 있었습니다.

Conclusion

이상으로 검열 저항성, 지역 다양성 두 가지 측면에서 블록체인 플랫폼의 탈중앙성에 대한 정량적인 접근을 시도해보았습니다. 해당 연구를 진행하면서 가장 어려웠던 점은 레퍼런스가 거의 존재하지 않는다는 것이었습니다. 사람별로 어떠한 것이 더 탈중앙화된 것인가는 항상 논쟁이 있었고 윗글에서 본 것처럼 어떠한 관점에서 바라보냐에 따라 해당 플랫폼의 탈중앙성은 다르게 평가될 수 있습니다. 따라서 최대한 다양한 관점에서 정량화된 탈중앙화 지수를 제시하고 이를 사용자들에게 제시함으로써 각각의 사용자들이 본인의 기호에 맞는 플랫폼을 선택하는 것이 건강하고 이상적인 블록체인 생태계라고 생각하며 글을 마칩니다.

디사이퍼(DECIPHER)는 “건강한 블록체인 생태계 조성에 기여한다” 라는 미션 아래 블록체인에 대해 연구하고 이를 실용적으로 응용하는 서울대 블록체인 연구 학회입니다. 2018년 3월에 처음 조직 되어 현재까지 블록체인 기술을 다방면에서 연구하고 산업계에 응용하고 있는 100명 이상의 회원들을 배출해왔습니다. 다양한 팀별 연구활동과 프로젝트, 컨퍼런스 개최, 서울대학교 블록체인 강의 개설, 유수 기업들과의 산학협력과 파트너십 체결을 해오며 국내 최고의 블록체인 학회로 자리 잡았습니다.

--

--