디지털 지도와 오픈 데이터를 바라보는 몇 가지 관점
지도 만드는 개발자라고 직업을 소개하면 종종 ‘어려서부터 지도를 좋아했나 봐요’ 하는 질문을 받게 된다. 그랬으면 좋았겠지만, 안타깝게도 어려서는 사회과부도 이외의 지도를 본 기억이 없다. 굳이 지도에 관련된 기억이라면, 가족이 먼 길을 이동할 때 여러 번 접어 두툼한 고속도로 지도를 손바닥 두 개만 한 크기로 편 후 이리저리 돌리며 방향을 읽는 어머니나 아버지를 뒷좌석에 앉아 바라본 기억 정도일까.
스마트폰을 구입한 이후에야 지도를 처음으로 손에 쥐어보았다. 처음으로 지도를 사용해 본 날은 친구와 저녁을 먹기로 하고 홍대에서 만난 날이었다. 신문물에 들떠있던 나는 이름만 들어본 식당을 찾아보겠다며 못 미더워하는 친구를 데리고 나섰다. 익숙한 거리니 식당 위치를 보면 어딘지 금방 찾을 수 있을 것으로 생각했지만, 지도에서 보는 홍대의 거리는 내 머릿속의 홍대와는 너무 달라 보였다. 나는 6번 출구로 나가서 직진, 빵집이 보이는 길에서 좌회전, 하는 방식으로 내 나름대로 친숙한 랜드마크를 몇 개 정해 방향을 잡곤 했다. 하지만 모바일 지도는 내 머릿속의 랜드마크와는 상관없이 최단거리의 경로를 보여주었고, 구심점을 잃어버린 나는 스스로가 지도 어디에 있는지, 어디에서 어느 방향으로 꺾어야 하는지 도저히 파악할 수 없었다. 결국, 식당을 찾는 데는 생각보다 훨씬 오랜 시간이 걸렸고, 저녁은 한참 늦어져 친구에게 굉장한 핀잔을 들었다.
지도와 데이터 그 사이
종종 매일 스마트폰을 통해 지도를 보면서 성장기를 보내는 세대들은 공간을 어떻게 다르게 인식하는지 궁금해질 때가 있다. 모바일 지도 길찾기에 적응하지 못한 나의 이야기는 굉장히 옛날이야기처럼 느껴지지 않을까 싶을 만큼, 일상에서 디지털 디바이스를 통한 지도의 쓰임새는 다양해졌다. 우리는 처음 가보는 장소를 어떻게 가는지 찾아볼 때 뿐 아니라, 자신의 위치를 친구들과 공유하거나, 새로 이사갈 집을 찾아보기 위해, 하루에도 몇번씩 지도(가 포함되어있는) 앱을 켠다.
우리가 사용하는 지도의 용도와 형태는 다양하지만 그 근간은 데이터이다. 지도의 쓰임새가 점점 다양해져가면서, 지도 데이터의 양 역시 점점 방대해지고 있다. 물론 이 방대한 양의 데이터가 사용자에게 전부 전달되지는 않는다. 특정 주제나 지역을 중심으로 한 지도가 아니라면, 보통 지도 제공업체는 사용자가 어느 지역을, 어느 정도 확대해서 보고있는지를 바탕으로 사용자가 필요한 데이터를 유추하여 사용자에게 전송한다. 이렇게 변환된 데이터는, 데이터의 속성과 중요도를 잘 나타낼 수 있는 기호를 통해 표현되어 사용자가 이해할 수 있는 형태로 보여진다.
지도에서 무엇을, 어떻게 보여줄 것인지 결정하는 것은 여러모로 어려운 문제이다. 서로 다른 이익이 충돌할 때는 더욱 그렇다. 예를들어, 같은 상가 건물 내에 가까이 붙어있는 치킨집과 국수집이 있다고 생각해보자. 상가내 배치도를 만드는 것이 아니라면, 서로 가까이 위치한 상점을 지도에서 모두 똑같은 시각적인 경중을 가지게 하는 것은 어렵다. 내가 만약 치킨집 운영자라면 치킨집이 지도에서 좀 더 잘 보이기를 바랄 것이고, 국수집 운영자라면 국수집이 지도에 보이기를 바랄 것이다.
두 상점 운영자의 바람과는 달리, 어떤 상점을 우선해서 보여줄지에 대한 결정권은 지도 서비스 제공 업체에 있다. 지도 데이터를 통해 이윤을 추구하는 지도 서비스 업체는 보통 사용자들에게 많은 정보를 공개하지 않는다. 지도 사용자들은 서비스 업체가 어떤 데이터를 가졌는지, 어떤 기준으로 사용자들에게 보여 줄 데이터를 선별하는지 등의 과정을 알 수 없다. 지도에 나타난 결과를 보면서 그 과정이 어땠을까를 짐작할 수 있을 뿐이다.
우리가 생활하는 공간은 정확한 해답보다는 논쟁으로 가득차있지만, 지도는 한 가지 입장에서 내린 결정을 마치 정답인 것처럼 보여준다.
지도와 관련된 이익의 충돌은 여러가지 규모로 일어난다. 2016년, 구글 지도에서 팔레스타인이 ‘사라진 것’이 큰 논란이 된 적이 있다. 구글 지도에서 팔레스타인을 검색결과로 찾을 수 없었던 팔레스타인 지지자들은 구글이 팔레스타인을 고의적으로 삭제했다고 짐작했고, 소셜 네트워크를 중심으로 #PalestineIsHere 해시태그를 사용하며 구글에 항의했다. 이에 구글은 ‘구글은 단 한 번도 팔레스타인 국가명을 표기한 적이 없기 때문에 지운 적도 없다. 다만 최근에 가자 지구와 웨스트뱅크 지역이 레이블되지 않는 버그가 발견되었다’ 라고 이 문제에 대한 공식입장을 발표하였다. 지금도 구글 지도에서는 팔레스타인을 국가명으로 표기하지 않는다. 사용자는 구글의 지도 데이터베이스에 팔레스타인이 국가로 저장이 되어있기는 한 건지, 혹은 저장이 된 데이터를 보여주지 않기로 결정한 것인지 알 수 없다. 이는 지도가 누군가에게 의해 해석된 결과물인 것을 보여주는 한 예시일 뿐이다. 동해/일본해 표기의 문제는 잊혀질 때 쯤 언급되는 한국의 단골 이슈이고, 식당 주인들은 지역 맛집 검색에 빠르게 잡히길 바라며 블로거들에게 대가를 지불하고 리뷰를 써줄 것을 청탁한다. 우리가 생활하는 공간은 정확한 해답보다는 논쟁으로 가득차있지만, 지도는 한 가지 입장에서 내린 결정을 마치 정답인 것처럼 보여준다.
우리는 하루에도 몇 번씩 지도를 보면서 일상적인 결정을 내린다. 처음 가보는 곳을 어떻게 찾아갈지, 주변에 점심을 먹을만한 식당이 어디인지, 지도를 보면서 답을 찾는다. 우리가 지도를 사용하는 사이, 지도 역시 알고있지 못했던 곳을 보여주거나 특정한 경로를 권유하며 우리의 소비패턴을 바꾸고 공간에 대한 인식을 변화시킨다. 지도가 우리의 인식에 미치는 영향을 생각해보면, 한 회사의 입장에서만 해석한 지도를 소비하는 것에 의문이 생긴다.
영리주체에게 지도 데이터는, 종종 속을 보여줄 수 없는 하나의 자산이다. 각 회사는 거리에 스트리트뷰 데이터를 모으는 자동차를 지역마다 풀고, 많은 인력을 동원해서 데이터를 모은다. 이렇게 많은 투자를 거쳐서 완성된 데이터는 큰단위의 돈이 오가는, 사고파는 장사 밑천이 된다. 다양한 지도를 만들 필요가 있는 개인들, 이를테면 도시환경디자이너나, 데이터 시각화가 필요한 언론인, 지도를 이용한 서비스가 필요한 창업자들은 지도 데이터를 사용할 때 종종 높은 장벽에 부딪히게 된다.
지도의 중요성이 대두되면서 지도 데이터를 많은 사람들이 저렴하게 접근할 권리가 있는 공공재로 배포하는 오픈 데이터가 늘어났고 이러한 공간정보 데이터를 수집, 배포하는 오픈소스 프로젝트들도 많이 나타났다. 전세계의 주소 데이터를 모아서 사용하기 쉬운 형식으로 가공하는 오픈어드레스나 포인트 오브 인터레스트(POI, 식당, 도서관 등 사람들이 관심있을 법한 장소)를 포함한 세계의 장소 데이터를 모으는 후즈온퍼스트, 통합적인 지도 데이터 콜렉션인 오픈 스트리트맵 등은 이러한 지도 데이터 오픈소스 프로젝트의 좋은 예시들이다. 다양한 종류의 데이터의 허브 역할을 해온 오픈스트리트맵의 경우를 보면서 이러한 프로젝트들이 어떻게 발전할 수 있었는지 알아보자.
오픈스트리트맵과 커뮤니티
오픈스트리트맵은 위키피디아의 성공에 영감을 받은 2004년 영국의 개발자 스티브 코스트Steve Coast에 의해 시작되었다. 사용자는 오픈스트리트맵에 지도 데이터를 추가하고 편집할 수 있을 뿐 아니라, 데이터가 어떻게 추가되고 수정되어왔는지 히스토리를 확인해볼 수도 있다. 이렇게 오픈스트리트맵에 저장된 데이터는 누구나 다운로드 받을 수 있으며, 영리적 목적으로 이용될 수도 있다. 실제로 지도를 테마로 한 카드나 프린트를 만드는 작은 개인 스튜디오에서부터, 검색이나 길찾기 등 지도 관련 풀스택 서비스를 제공하는 회사까지 다양한 형태의 회사들이 오픈스트리트맵의 데이터를 사용하고 있다. 오픈스트리트맵을 사용하는 회사는 오픈스트리트맵 데이터를 소비하기도 하지만, 오픈스트리트맵의 데이터 질을 향상시키는데 기여하기도 하고, 오픈스트리트맵을 더 쉽고 편하게 활용할 수 있도록 데이터 가공, 장소검색, 길찾기등의 부가기술 등을 개발하기도 한다. 오픈스트리트맵 데이터를 기반으로 한 기술을 개발하는 회사들은, 회사의 흥망과 상관없이 오픈스트리트맵을 편하게 이용할 수 있는 기술이 유지, 발전될 수 있도록 개발된 서비스의 일부를 오픈소스로 개방하기도 한다.
오픈스트리트맵에서 집 근처 슈퍼나 좋아하는 등산로 등을 찾을 수 없다면, 사용자는 언제든 그 데이터를 추가할 수 있다. 사용자들은 GPS를 기록하거나, 위성 사진을 대고 그려서 (트레이싱) 오픈스트리트맵에 데이터를 추가할 수 있다. 건물이나 도로 등의 공공데이터를 공개한 지역의 경우, 해당 지역에 거주하는 사용자들이 이러한 데이터를 가져와 (데이터 임포팅) 오픈스트리트맵에 기여하기도 한다.
오픈스트리트맵을 지탱하고 있는 ‘집단 지성’은 위험한 개념이기도 하다. 많은 사람들이 오랫동안 쌓아온 노력이 어느 날 한 사람의 실수나 악의로 인해서 사라질 수 있기 때문이다. 어느 날, 할 일도 없고 지도 데이터도 필요하고 해서 혼자서 한 동네를 전부 맵핑했다고 해보자. 다음 날 일어났을 때 그 데이터가 온전할 것이라는 보장은 없다. 나도 편집을 하다가 실수로 일본 국가명을 삭제해버린 적이 있었다. 데이터 체인지를 저장한 후에야 일본이 사라졌다는 사실을 깨닫고 등골이 서늘해져 서둘러 데이터를 복구했던 기억이 난다.
오픈스트리트맵은 데이터가 한 사람의 실수나, 악의로 훼손되는 피해를 최소화하기 위해 커뮤니티의 역할을 강조한다. 내가 받았던 경고 이메일처럼, 온라인을 통해 커뮤니티의 의사소통이 이루어지기도 하지만, 지역을 잘 아는 현지 주민들이 데이터 편집 방법도 배우고 실제 편집하는 모임을 열기도 한다. (보통 이런 모임들을 맵파톤Mapathon, 맵타임Maptime이라고 부른다.) 이러한 모임을 통해 초심자들은 좀 더 경험있는 기여자들을 만나 오픈스트리트맵의 편집에 대한 팁을 배우며, 지도가 공동의 노력을 통해 만들어지는 과정을 관찰하게 된다.
나의 첫 맵핑 모임은 회사 동료들이 네팔 대지진 후에 사내에서 작게 연 맵핑 모임이였다. 오픈스트리트맵 편집 경험이 상대적으로 많은 동료가 오픈스트리트맵의 기본 에디터인 iD를 사용하는 방법과 현장에서 구조작업을 하고있는 사람들이 지도가 필요한 지역을 정리해놓은 OSM Tasking Manager 사용법을 보여준 후 다 함께 편집을 시작했다. 편집을 마친 후 내가 맵핑을 잘한 건지 확신이 아무래도 서지 않아서, 모임을 주도하던 동료에게 마치 허락을 구하는 것처럼 이런저런 질문을 많이 했다. 동료는 질문이 많은 나에게 처음 오픈스트리트맵을 접하는 사람들, 특히 여성 사용자들이 완벽함에 대한 부담감을 많이 느끼는 경향이 있다고, 분명히 도움이 되는 데이터일 것이라며 도움이 되는 말을 해주었다. 이 경험은 내가 신뢰를 바탕으로 다른 오픈스트리트맵 구성원과 소통하는 데에 큰 도움을 주었다.
물론 오프라인 모임이 아니더라도, 위키 페이지, 이메일 리스트, 슬랙 채널 등을 통해 오픈스트리트맵 커뮤니티의 각종 이슈와 정보를 공유할 수 있다. 오픈스트리트맵 커뮤니티는 이러한 온라인 툴을 적극적으로 이용하여 적당해 보이지 않는 데이터 변동사항에 관해 토론을 하거나 주의를 주기도 하고, 사용자의 데이터 편집을 도울 수 있는 도구 개발이나 도큐멘테이션의 발전 등을 주도하기도 한다.
한국의 오픈 데이터
오픈스트리트맵 등 여러 오픈소스 지도 데이터 프로젝트의 데이터를 사용하는 지도 회사에 근무하면서, 한국의 오픈스트리트맵에 충분한 데이터가 없어서 아쉬운 적이 많았다. 2017년 이전까지 한국의 오픈스트리트맵은 편집자가 적고, 데이터가 적기 때문에 사용자가 없는 악순환이 계속 반복되고 있는 것처럼 보였다.
2017년, 이러한 악순환의 고리를 끊는 사건이 생겼다. 사용자의 위치를 이용한 게임을 꾸준히 만들어온 게임회사 나이안틱Niantic Inc.이 오픈스트리트맵 데이터를 이용하여 한국에 포켓몬 고 서비스를 런칭한 것이다. 포켓몬 고 한국 사용자들은 본인이 활동하는 지역의 오픈스트리트맵 데이터가 충분하지 않을 때 포켓스탑이 생성되지 않는 다는 것을 알아내었고, 이후 오픈스트리트맵의 한국 사용자들은 눈에 띄게 늘었다. 과연 한국에서 오픈스트리트맵이 자리잡기 시작할 수 있을까가 늘 의문이었던 나에겐 정말 놀라운 변화였다.
물론 급속도로 늘어난 사용자들로 인한 해프닝도 보였다. 데이터 편집 기록을 살펴보면 지형지물로서의 가치가 없는 편집도 보였고, 반달리즘으로 보이는 에딧들도 늘어났다. 지형지물의 형태만 존재하고 그 외의 관련 데이터는 존재하지 않는 경우도 많았다. 트레이싱한 데이터를 전부 삭제해야 하는 문제가 생기기도 했다. 오픈스트리트맵이 트레이싱을 위해 제공하는 인공위성 이미지의 해상도가 높지 않아, 사용자들이 국토교통부 인공위성 이미지를 그대로 끌어온 것이다.
오픈스트리트맵은 데이터를 누구나 무료로 다운로드 받아 사용할 수 있기 때문에 원본 데이터 역시 무료로 모두에게 개방되어있어야 한다. 이를테면 상용 위성 사진을 이용해서 트레이싱한 데이터나, 특정한 요구사항이 포함된 라이센스가 걸려있는 데이터 등은 오픈스트리트맵에 저장될 수 없다. 한국의 사용자들이 트레이싱의 배경 이미지로 사용하여 문제가 된 위성사진의 출처는 국토교통부가 공간정보를 국민이 자유롭게 사용할 수 있게 만들어놓은 오픈플랫폼 브이월드였다. ‘자유롭게 사용’할 수 있다면 이 위성 이미지가 오픈스트리트맵 트레이싱에 사용되는 게 왜 문제가 되었을까.
문제는 한국의 법이다. 공간정보의 구축 및 관리 등에 관한 법률 16조 1항은 국가 주도로 측량된 데이터가 한국의 물리적인 경계를 넘는 것을 금지한다. 자세한 법조항은 다음과 같다. “누구든지 국토해양부장관의 허가 없이 기본측량성과 중 지도등 또는 측량용 사진을 국외로 반출하여서는 아니 된다. 다만, 외국 정부와 기본측량성과를 서로 교환하는 등 대통령령으로 정하는 경우에는 그러하지 아니하다.”
내가 오픈스트리트맵 기여자로 활동하면서, 이 법에 대해 깊이 생각하게 되는 순간들이 있었다. 그 중 하나는 국가정보 공간포털에 무료로 개방된 한국의 건물 데이터를 발견했을 때였다. 건물 데이터는 건물의 형태뿐 아니라 높이, 주소, 용도 등 다양한 건물의 속성을 포함하고 있었다. 도시의 건물이 빼곡하게 찬 오픈스트리트맵을 상상해보면서, 이 데이터를 임포팅하면 한국의 오픈스트리트맵 데이터의 질이 높아지지 않을까, 좀 더 욕심을 내서 커뮤니티가 부재한 한국에서 오픈스트리트맵 커뮤니티가 촉발될 수 있는 활동이 될 수도 있지 않을까 하는 생각이 들었다. 국가정보공간포털 게시판에 라이센스를 문의하자 전화 달라고 하는 대답을 받았는데, 이 대답 때문에 ‘안 되는 거면 안 된다고 대답하지 않았을까, 어쩌면 될지도 몰라!’ 하고 기대가 더 커진 것 같기도 하다. 시차에 맞춰 전화를 할 시간을 찾을 수가 없어 몇 주 후에야 연결된 담당자분께 받은 답변은 “외국이시면 안 됩니다”라는 것이었다. (오픈스트리트맵 서버는 런던에 있다.)
대답은 명쾌했지만 ‘외국이어서’라는 이유는 나에게 많은 의문을 남겼다. 이를테면, 내가 한국에 들어가서 지도 데이터를 내 컴퓨터에 저장한 후 출국하면 어떨까. 내가 지금 앉아있는 뉴욕에서 한국 지도 서비스를 이용해서 친구 집을 찾아본다면? 아주 적은 양이긴 하지만 이 과정에서 지도 데이터가 나의 컴퓨터로 넘어온다. 데이터의 양이 미미해서 괜찮다면, 한 동네의 데이터만 추출해서 해외에서 사용하면 괜찮은 걸까? 지도회사에서 후가공한 데이터라 괜찮다면, 어느 정도로 데이터를 변형해야 반출이 가능해지는 걸까? 데이터의 형식만 바꾸거나, 모든 건물 이름에 의미 없는 단어를 끝에 붙여서 반출을 시도해본다면? 만약 내가 건물 데이터 중 높이만 암기해서, 이 지식을 바탕으로 오픈스트리트맵에 입력하면 어떨까. 물리적인 공간에 구속받지 않는 디지털 데이터를 물리적인 경계에 귀속시키는 한국의 지도법은, 너무 많은 질문을 불러일으킨다.
공공기관을 중심으로 한 오픈 데이터는, 데이터를 필수 인프라로 정의하고 많은 사람이 저렴하게 데이터를 사용할 수 있도록 만드는 노력의 일환이다. 만약 서울의 대중교통 데이터가 오픈 데이터가 아니었다면, 큰 기업이 아닌 개인이 서울의 대중교통 관련 애플리케이션을 만들고 성공하는 것은 불가능한 이야기였을 것이다.
물을 편리하게 사용하기 위해서 상하수도 시스템이 필요한 것처럼, 오픈 데이터도 사용자의 기술적인 숙련도가 사용에 큰 장애물이 되지 않도록 도와주는 파이프가 필요하다. 오픈스트리트맵의 경우 오픈스트리트맵을 기반으로 한 오픈소스 프로젝트나 비즈니스들이 이러한 파이프 역할을 한다. 개발 업무 환경에서 흔하게 쓰이는, 데이터 형태를 쓰기 편하게 전환해주는 서비스나, 서버 유지 등의 업무를 대행해주는 서비스 역시 데이터를 쉽게 사용하게 만들어주는 도구라고 볼 수 있다. 한국의 지도법에 따르면 사용자들은 이러한 서비스들을 사용할 때도 서버가 어디에 있는지를 따져가며 사용해야 한다. 이 과정에서 사용자들은 데이터 활용과는 크게 관계가 없는 부분에 에너지를 쓰게 된다.
국가정보공간포털의 각 데이터 페이지에는 관련 데이터 담당자의 이름과 전화번호가 쓰여 있는 경우가 있다. 나는 면식 없는 담당자의 이름을 읽어보면서, 막 시작하는 오픈 데이터 플랫폼에서 생기는 문제와 씨름하고 있을 많은 사람을 생각해보곤 한다. 오픈스트리트맵을 사용하는 회사에서 일하면서, 당장의 영리적인 수익을 내지 않는 오픈 데이터를 유지하기 위해 얼마나 많은 사람의 노력이 들어가는지 봐 왔기 때문에 더 이런 생각이 든다. 많은 투자와, 많은 사람의 노력이 들어갔을 한국의 지도데이터가, 국경의 틀에 갇히지 않고 이 복잡한 세상을 분석하고 이해하는 데에 도움이 되는 지도를 만드는 밑천으로 쓰였으면 좋겠다고 바라본다.