데이터 스토리텔링 독서후기

책 ⌈데이터 스토리텔링⌋을 읽고 밑줄그은 내용과 간단한 후기를 작성해 본다. 사내에서 강력한 추천을 받았고, 프론트 엔지니어로서도 필요한 내용이라는 생각이 들어 읽게 되었다. 내용이 좋아 밑줄을 팍팍 긋게되는 책이다.

“프레젠테이션을 위한"이라는 수식어가 붙어있긴 하지만, 시각화 일반에 대한 기초적인 기법들을 다루고 있으므로 데이터 시각화를 다루는 분야에 계신분이라면 모두 도움이 될만한 책이다.


사람들은 자주 탐색용 분석이 설명용 분석의 대상이라면, 모든 탐색용 분석 과정을보여주는 것이 괜찮다고 생각하는 실수를 범한다. 즉 앞의 예제에 비유하면 2개의진주만을 보여주는 것이 바람직하지만, 데이터를 정보로 변환하는 과정을 모두 설명하기 위해 100개의 굴을 보여주는 것은 문제가 없다고 생각한다. 이러한 생각은 잘못된 것이지만 이해가 가는 부분이기는 하다. 전체 분석 작업을 마친 후에, 작업한내용 전부와 분석의 신뢰도가 높다는 점을 입증하기 위해 모든 과정을 청중에게 설명하고 싶을 것이다. 이와 같은 의지를 버려라. 여러분은 지금 청중이 쓸데없이 100개의 모든 글을 다시 열어보도록 하고 있는 실수를 범하고 있는 것이다! 청중이 꼭알아야 하는 정보인 2개의 진주에만 집중하라. — 36p

되돌아보면 내가 관여했던 서비스들에서 이런적이 꽤 있었던것 같다. 정성과 노력이 들어가면 갈 수록 더 그런 경향이 높아진다. 이럴때는 애착이 독이 될 수 있다. 내가 만드는 서비스로부터 한발 물러나 사용자의 시점으로 돌아가야한다.

영역그래프와 3D를 피하라

나는 영역 그래프를 가장 싫어한다. 인간의 눈은 2차원 공간에 수치값을 배치하는데 있어 뛰어난 능력을 발휘하지 못한다. 이는 논의했던 다른 유형의 가시적 표현보다는 읽기 어려운 영역 그래프를 표시하기 때문이다. 이와 같은 이유로 인해 한 가지 예외 상황인 상당히 다른 양의 숫자를 시각화할 필요가 있을 때를 제외하면 영역그래프의 사용을 피하도록 한다. 그림 2.20에서 볼 수 있듯이 일차원보다 간결한 방법으로 사각형을 이용한 이차원을 실행 가능하도록 한다. — 75p
3D를 없애버리고 원을 평평하게 만들더라도 해석은 어렵다. 인간의 눈은 정량적 값을 2차원 공간에 표현한 결과를 정확하게 인식하지 못한다. 더 간단히 말하면 파이 차트는 가독성이 떨어진다. 각 구분 영역의 크기가 유사하다고 하면 불가능하지는 않지만 어느 쪽이 큰지를 분별해내기가 어렵다. 크기가 유사하지 않더라도 크기비교만 가능할 뿐 얼마나 큰지를 판단할 수 없다. — 79p

연결성

우리가 중점적으로 살펴봐야 할 마지막 게슈탈트 원리는 연결성connection이다. 일반적으로 사람은 물리적으로 연결된 객체를 그룹의 일부로 생각하는 경향이 있다. 연결된 특성은 일반적으로 유사한 색상, 크기, 모양보다 강한 연관성 있는 값을 갖는다. 그림 3.11에서 여러분은 유사 색상, 크기, 모양보다 선으로 연결된 모양을 쌍으로 인식한다. 이러한 현상은 연결성 원리가 작동하기 때문이다. 일반적으로 연결 특징은 공통성보다 약하다. 하지만 원하는 시각 계통을 만들기 위해 선의 두께와 명암을 이용해 이러한 관계에 영향을 줄 수 있다. 4장에서 사전 주목을 이끄는 속성을 설명할 때 시각계통에 대해 좀 더 많은 것을 설명하겠다. — 96p

여백

전략적으로 사용한 여백은 시각화 자료에서 그만큼 강력한 효과가 된다. 여백이 부족하면 발표 내용에 잠시 쉬어감이 없을 정도로 청중이 부담을 느낀다. 시각화 자료의 설계에 대한 청중의 부담은 피해야 하는 것이다. 여백은 전략적으로 사용해 여백이 아닌 부분에 주목하도록 하는 것이 좋다. — 101p

회색

나는 일반적으로 회색 계열로 시각화 자료를 설계하고 난 다음 원하는 부분에 주목을 끌기 위해 한 개의 진한 색상을 선택했다. 나의 기본 색상은 검정이 아닌 회색이다. 검정보다 회색에 대해 색상을 좀 더 돋보이게 할 수 있기 때문에 좀 더 두드러진 대조 효과를 얻어낼 수 있다. 여러 이유로 인해 나의 주목을 끄는 색상으로 나는자주 청색을 사용한다. — 133p

혼란스러움 제거

중요 부분을 강조하는 반면에 혼란스러운 부분을 제거 한다. 생텍쥐 베리는 그의 책 『Airman’s Odyssey』에서 유명한 말을 했다. “여러분이 추가할것이 더 이상 없을 때가 아니라 제거할 것이 더 이상 없을 때 완벽함을 이루었다는것을 깨닫게 된다(생텍쥐베리, 1943).” 데이터 시각화를 설계의 완벽함과 관련해 어떤 것을 제거할지 또는 강조하지 않을 것인지에 대한 결정은 무엇을 포함시킬 것인지 또는 강조할 것인지보다 더 중요하다. — 148p

어디서 많이 들어보지 않았는가. 서비스에 기능을 추가할때 많이 하는 이야기이다. 어린왕자를 쓴 생텍쥐베리가 저런 명언을 했다니, 이 부분을 읽으면서 잠시 멍해졌다.

나는 종종 예측 값이 나머지 값과 구분되어 있지 않은 상태로, 한 개 라인에 예측 값과 실제 값이 모두 표시되어 있는 경우를 본다. 이러한 표시는 잘못한 경우라고 할 수있다. 시각 신호를 이용하면, 실제와 예측 데이터 간 구분할 수 있으며 정보를 쉽게 해석할 수 있다. 그림 6.2에서 실선은 실제 데이터이고 가는 점선은 예측 데이터다. 점선은 실선, 두꺼운 선보다 확실하지 않은 내용을 의미하는 정보를 제공한다. x축 아래의 실제와 예측을 명확히 표현해 이를 강조했다. 쉽게 파악하기 위해 모든 캡션을작성했다. 예측 부분은 배경으로 연한 그림자를 표현해 약간 다르게 구분했다. — 175p

헤드라인 먼저 작성하라

전체 프리젠테이션이나 커뮤니케이션의 흐름을 구성할 때, 한 가지 전략은 가장 먼저 헤드라인을 만들도록 하는 것이다. 1장에서 논의했던 스토리보딩으로 돌아가보자. 포스트잇에 각 헤드라인을 작성해보자. 명확한 흐름 전개를 만들기 위해 순서를 구성하고 각 아이디어를 연결해논리적인 흐름이 되도록 하자. 이러한 종류의 구성을 선정해 청중이 이해할 수 있는 논리순서가 되도록 하자. 각각의 개별 헤드라인을 여러분의 프리젠테이션 슬라이드의 타이틀이나 작성한 리포트의 섹션 타이틀이 되도록 하자. — 195p

이 외에도 주옥같은 내용들로 가득한 책이다. 무엇보다 이 책에서 말하고 있는 “타겟에게 요구되는 핵심을 쉽고 정확하게 전달하기"를 이 책 스스로 잘 실천하고 있다.


잘못된 정보나 좋은 의견이 있다면 언제든지 댓글 부탁드립니다. 박수는 글쓴이를 춤추게 합니다. 👏👏