최근에 정보 시각화 / 데이터 시각화 / 인포그래픽과 같은 단어가 많이 언급되기 시작하였습니다. 많은 사람들이 어떤 내용을 기존의 틀에서 벗어나 시각적으로 얼마나 효율적으로 그리고 아름답게 나타낼 지에 많은 관심을 가지고 있습니다. 그만큼 좋은 책들이 나오고, 사용할 수 있는 도구들도 많아지고 있습니다.
이러한 현상은 비교적 몇년 사이에 급속히 활발하게 진행되었습니다만, 시각화라는 주제는 짧지만 긴 역사를 가지고 있습니다. 2015년 현재 우리는 막대 그래프라거나 꺾은 선 그래프 같은 것들을 마치 알파벳만큼이나 친숙하게 이해하고 그릴 수 있습니다. 이 그래프들의 시초에 대해서는 아는 사람은 많지 않습니다만, 이 그래프들을 처음으로 “발명한 것”은 스코틀랜드의 엔지니어였던 윌리암 플레이페어(William Playfair)였습니다.
윌리암 플레이페어의 1786년의 저작 Commercial and Political Atlas라는 책에서는 당시 유럽 국가들의 상황을 국가별로 해설해나갑니다. 그리고 그러한 해설의 이해를 돕기 위해 처음으로 꺾은 선 그래프와 막대 그래프를 세상에 소개합니다. 데카르트가 17세기 좌표축을 발명한 이래로 통계적인 수치들이 좌표축을 기반으로한 통계적인 평면 위에 처음으로 (발명되고) 올려지게 됩니다. 심지어 이 그래프들은 지금 그려지는 일반적인 그래프들보다도 더 섬세하고 세련됩니다.
이 기념비적인 저서는 2005년 캠브릿지 대학 출판사에서 원형 그대로 재출간되었습니다.
이 이외에도 시각화라는 분야에 직간접적인 영향을 준 고전들은 적지 않습니다. 특히 아름다운 사례들을 수집하고 시각화의 원리와 기법들을 정리하려고 했던 Edward Tufte 교수의 3연작이라고 일컬어지는 Quantitative Information(1983), Envisioning Information(1990), Visual Explanations(1997)은 시각화 이야기 어디에서도 빠지지 않을 정도로 유명합니다. 지도학자였던 Jacques Bertin은 시각화 방법론과 표현 방법에 대한 Semiology of Graphics(1967)라는 책을 쓰기도 했습니다. 또한 일찍이 데이터의 폭발적인 증가와 컴퓨터를 통한 분석 및 통계학 방법론의 변화를 예견한 John Tukey 교수는 탐색적 데이터 분석에 대한 Exploratory Data Analysis(1977)를 썼으며, William Cleveland 교수는 The Elements of Graphing Data(1994)와 Visualizing Data(1993)에서 통계적 그래프를 작성하는 방법들을 소개합니다. 이외에도 시각화를 인지 관점에서 다루고 있는 Colin Ware의 Information Visualization(2012), Processing을 만든 Ben Fry의 Visualizing Data(2008), 지금은 R에서 가장 유명한 라이브러리가 되어버린 그래프 도구 ggplot2를 만든 Hadley Wickham이 직접 쓴 ggplot2(2009), 그리고 이 ggplot2의 이론적 기반이 된 The Grammar of Graphics(2005) 등도 빼놓을 수 없습니다.
이러한 책들의 저자와 저서들은 이미 시각화라는 단어가 언급될 때면 터줏대감처럼 등장하며, 시각화 분야에 초석을 마련한 책들이라고 봐도 무방힙니다. 하지만 막상 한국어로 번역된 책도 드물고, 혼자서 읽는 것도 쉽지 않습니다.
이에 2015년 7월 중순부터 정보시각화 관련 고전을 읽고 토론하는 독서 모임을 시작하려고 합니다.
The Grammar of Graphics
독서 모임에서 처음으로 읽을 책은 Leland Wilkinson의 The Grammar of Graphics입니다. 2015년 현재 R을 쓰는 사람이라면 모를 수 없는 라이브러리가 다름아닌 ggplot2입니다. ggplot2는 다양한 기능과 깔끔한 기본 템플릿을 제공하면서 많은 사랑을 받았으며, 이제는 R에서 가장 많이 사용되는 그래픽 라이브러리일 뿐만 아니라 가장 유명한 R 패키지가 되었습니다. 이 ggplot2에서 앞의 gg는 다름아닌 The Grammar of Graphics의 줄임말입니다. The Grammar of Graphics는 그래프의 구조적인 분석을 시도하고 그것들을 표현할 수 있는 방법을 찾아나갑니다. 시각화 과정을 정식화하고, 데이터로부터 시각적 요소로 맵핑하는 방법들에 대해서 다루고 있습니다. 이렇게 문법적으로 그래프를 해체하고 조립하는 방법론은 ggplot2에서 이름에서 이름에서부터 드러내놓고 사용하고 있을 뿐아니라, 파이썬의 bokeh를 비롯해 자바스크립트의 d3.js나 vega와 같은 라이브러리에도 영향을 준 것으로 평가됩니다.
독서 모임
먼저 도서는 각자 편하신 방법으로 구매해주시기 바랍니다. 현재 Amazon에서 구매가능하며 kindle판도 있습니다. 적절한 권한이 있다면 Springer Link에서 다운로드 받을 수도 있습니다.
독서모임은 한 주에 2챕터(50페이지 내외)씩 각자 책을 읽고, 돌아가면서 발표하는 방식으로 진행할 예정입니다. 발표는 30분 내외로 내용과 궁금했던 점을 이야기하면서 일방적으로 발표하기보단 자유롭게 이야기하면서 진행하고자 합니다. 발표 이후에도 자유롭게 이야기하고 유동적으로 총 한 시간에서 한 시간 반 정도로 진행할 예정입니다.
참석자
규모는 (계속해서 책을 읽을 의지가 있는 분들에 한해서) 작게 유지할 생각입니다만, 진행 중에 불참자가 늘어날 수 있으므로 10명 내외로 진행할 예정입니다. 책을 읽고 따라와야 하므로 중간 참여는 어렵다고 보고 있으며, 한 권이 끝나는 시점에 추가로 참석자를 모을 예정입니다.
참석자들은 infoviskr 슬랙에 가입해주시고, #infovis_classic에 참석을 권장합니다(의무는 아닙니다).
아래 참석자 명단은 비확정이며, 사람이 많을 경우 먼저 참여 의사를 밝혀진 순서대로 확정할 예정입니다.
- nacyot
- jw*
- le*
- ra*(미정)
- ju*(미정)
- 트위터에서 참석 의사를 밝혀주신 분들.
오리엔테이션
7월 15일(수) 오후 7:30 토즈 강남점 — 강남역 2번 출구(확정)
일정
7월 마지막 주부터 10주. 평일 중 하루. 7:30 ~ 9:00 예정.
장소
강남역 근처의 토즈(미정).
참가비
참가비는 커뮤니티 지원 신청 진행중이라 아직 미정입니다. 지원을 받지 못 하거나 다른 장소 지원자가 없을 경우 토즈 이용료 정도를 회비로 걷을 수도 있습니다.
운영
infovisKR(정보시각화 스터디). 모임 운영자는 nacyot입니다.
끝으로
많은 관심 부탁드립니다 :)