페이스북 데이터 스캔들, 시작은 2010년이었다

Sungkyu Lee
Mediagotosa

--

같은해 1월 저커버그 “프라이버시 시대는 죽었다"…그래프api 설계에 반영

개인정보에 대한 저커버그의 인식

페이스북 데이터 스캔들의 씨앗은 2010년에 뿌려졌다. 기술은 설계자의 가치체계가 반영될 수밖에 없는 구조라는 측면에서 그렇다. 기술 설계자가 살아온 배경, 그리고 기술을 대하는 철학이 기술 자체에 영향을 미치고 기술을 구성하게 된다.

2010년 1월, 페이스북 창업자인 저커버그는 “프라이버시의 시대는 죽었다”라고 선언했다. “페이스북의 프라이버시 정책은 어떤 방향으로 전개되느냐”는 테크크런치 창업자 마이클 애링턴의 질문에 대한 응답이었다. 그의 짧고도 강력한 이 한마디는 이후 페이스북의 기술적 설계의 방향을 결정짓는데 중대한 영향을 미쳤다. 아니 이미 미치고 있었는지 모른다. 그의 얘기를 조금더 들어보자.

“지난 5~6년 동안 블로깅은 엄청난 방법으로 부상했으며, 사람들이 이 모든 정보를 공유하는 다양한 서비스도 등장하게 됐다. 사람들은 더 많은, 더 다양한 종류의 정보를 공유하고 있을 뿐만 아니라 이로 인해 더 개방적으로, 더 많은 사람들과 함께 편안하게 지낼 수 있게 됐다. 그 사회적 규범은 단지 시간이 지남에 따라 진화한 것이다. 우리는 그것을 지속적으로 혁신하고 현재의 사회적 규범이 무엇인지 반영하도록 시스템을 업데이트하는 것을 우리의 역할이라고 생각한다.”

저커버그에게 ‘프라이버시의 시대’는 낡은 것이었다. 변화하는 사회적 규범에 어울리지 않는 무언가였다. 따라서 프라이버시는 보호의 대상이 아니라 개방과 교환의 대상일 수밖에 없었다. 그것이 당시의 사회적 규범이었고 흐름이었고 미래였다고 그는 믿었다. 페이스북 데이터 스캔들은 이 시점부터 발아됐다고 말할 수 있는 이유다.

그의 발언은 2010년 그래프 API, 2013년 그래프 검색이라는 거대한 데이터 네트워크의 공개로 이어졌다. “세상을 더 개방시키고, 연결시키는 것이 우리의 미션”이라는 명분이었다. 기존의 웹 검색과는 차별화한 페이스북만의 검색, 그것은 소셜그래프를 바탕으로 사람들의 연결된 구조를 밖으로 드러내고 연결된 지점을 찾아내는 방식이었다.

여기서 언급된 그래프 API가 바로 데이터 스캔들의 핵심이다. 2010년부터 시작된 페이스북의 그래프 API 개방 정책을 이해하지 못하면 사건의 맥락이 이해되지 않는다. 이 정책 또한 저커버그의 철학과 가치관, 당시 사회적 흐름이 투영된 사회적 구성물인 것이다.

그래프API로 Facebookverse를 꿈꾸다

2013년 당시 그래프 API로 수집할 수 있었던 데이터의 범위. ‘친구 데이터 허용’ 탭이 분리돼있을 정도로 방대했다.

그래프 API는 콘텐츠를 인덱싱 하지 못한(혹은 않았던) 페이스북이 기존의 웹검색과 자신을 차별화하고, 페이스북의 폭발적인 성장을 견인했던 토대 요소였다. 뿐만 아니라 페이스북과 페이스북 외부를 연결시키는 핵심적인 고리기도 했다.

그래프 API는 사람과 사람, 사람과 페이지(사물)의 연결망을 데이터화하고, 이것들의 관계를 규정하는 모든 양식들을 응축한 거대한 네트워크의 상품화 작업이었다고 해석해볼 수 있다. 그리고 이 관계망을 외부의 사업자들이 사용자의 허락을 받아 접근하고 활용할 수 있도록 한 정책의 부산물이었다. 이를 통해 페이스북은 웹을 대체하겠다는 거대한 구상을 현실화하게 됐다.

이를테면, 외부 사업자(3rd Party) 고유한 사용자ID값을 획득하게 되면, 해당 사용자의 프로필 정보뿐 아니라 그의 친구 관계망, 친구의 선호 데이터 등을 광범위하게 취득할 수 있다는 의미다. 아래 이미지는 2013년 당시 그래프api로 접근할 수 있었던 데이터의 범위다. 접근을 허락한 사용자의 데이터뿐만 아니라 그들 친구들의 데이터까지 외부 사업자(3rd Party)는 확보할 수 있었다.

“프라이버시의 시대는 죽었다”라는 저커버그의 선언은 2010년 그래프 API로 실체화됐고, 2013년 그래프 검색을 통해 확장된 것이다. 페이스북을 빠르게 성장시킨 동력 또한 그래프 API의 공개였다고 규정지을 수 있다. 온갖 블로그에 게시된(임베드) ‘좋아요’ 버튼, 페이스북 소셜 로그인 등은 페이스북 밖의 세계까지 페이스북으로 빨아들이는 블랙홀 장치로 기능했다. 그래프 API를 활용한 외부 사업자들은 빠른 속도로 늘어났고, 그들 또한 페이스북에 버금가는 사용자 데이터를 얻어낼 수 있게 됐다. 페이스북은 이를 통해 거대한 ‘Facebookverse’를 구축하고 싶어했다.

어떻게 수집 규모는 눈덩이가 됐나

2018년 현재 제공되는 그래프API 제공 범위

당시 발표된 그래프 API는 27만명의 사용자ID로 5000만명 이상의 프로필 데이터를 취득할 수 있게 한 마법의 열쇠다. 쉽게 말해, 외부 사업자가 그래프 API를 통해 특정 사용자의 ID값만 얻을 수 있으면, 그의 친구 데이터까지 모조리 수집할 수 있다는 의미다. 해당 사용자가 1000명의 친구와 페이스북에서 관계를 맺고 있으면, 1명 사용자의 고유값으로 1000명의 데이터까지 접근할 수 있다. 코건 교수로부터 구매한 27만명 사용자 고유값만으로도 캠브리지 애널리틱스가 5000만명의 데이터를 분석해낼 수 있었던 비밀인 셈이다.

비단 캠브리지 애널리틱스에만 해당하는 사례는 아니다. 이미 다양한 방식으로 광범위한 사용자 데이터를 확보한, 심지어 그 정보를 저장까지 한 사업자들은 지금도 그들의 데이터를 구매할 대상을 찾고다니고 있을지 모른다.

저커버그의 ‘Facebookverse’ 구축 야망은 번번이 걸림돌을 만나게 된다. 끊임없이 제기된 프라이버시 침해 논란은 2015년, 그래프 API의 데이터 접근 범위 제한으로 이어졌다. 같은 해 4월 개최된 F8 콘퍼런스에서 페이스북은 친구의 친구 데이터에 접근하는 경로를 모든 차단하는 그래프 API 2.0을 발표했다. 이미 2014년부터 이러한 조치들이 취해지긴 했지만, 공식화한 것은 2015년이었다. 대략 이때부터 친구의 친구 데이터에 대한 접근은 사실상 차단을 당하게된다.

그의 성급했던 선언 “프라이버시는 죽었다”

“프라이버시의 시대는 죽었다“던 저커버그의 가치 선언은 그래프 API를 통한 광범위한 데이터 접근을 가능케했다. 그리고 웹을 대체하겠다는 그의 구상을 현실화시킬 수 있는 꿈도 실은 2010년 이 선언으로부터 배태됐다고 말할 수 있다. 하지만 사회적 저항에 부딪혔고, 서서히 조정을 해내가는 수순을 밟게 된다. 이때까지도 페이스북버스를 구축하겠다는 그의 구상은 달라지지 않았다. 외부사업자를 통해 새어나간 데이터가 어떤 방식으로 남용될지 그 또한 예측할 수 없었기 때문이었다.

코건 교수와 캠브리지 애널리티카의 연결, 그리고 트럼프캠프와의 연쇄적 결합은 그의 구상과 선언이 얼마나 성급했는가를 증명하는 결정적 사건이 됐다. 사회문화적 변화를 기술의 힘만으로 추동할 수 있을 것이라는 그의 야심찬 욕망이 왜 무모한지를 확인하는 계기가 됐다. 지금 저커버그에 요청해야 할 것은 사과 그 자체가 아니다. 무엇에 대한 사과인가이다. 데이터 관리의 문제에 대한 사과는 얼마든 기술적 조치에 따라 쉽게 행할 수 있지만, 그 근본을 바꿔놓진 못한다. 지금 저커버그에게 질문해야 할 것은 “여전히 프라이버시의 시대는 죽었다고 보느냐?”다. 그리고 “프라이버시의 시대가 죽었다는 걸 사용자들, 세계의 시민들은 받아들이고 있다고 보느냐?”이다. 기술 설계자의 가치관이 변하지 않으면 제2, 제3의 데이터 스캔들은 얼마든지 재발될 수 있다.

더 읽어볼 거리

--

--

Sungkyu Lee
Mediagotosa

MediaLab Director@Mediati /ex-ohmynews journalist, Daum 'bloggernews' editor, 'Tatter&Media' Chief Editor, Maeil Business newspaper researcher, CEO at Muzalive.