공공 데이터의 탐험적 분석: 한국의 자살률 급증, 그 원인은?

Jin Young Kim
Korean Medium Post
Published in
10 min readSep 19, 2015

공개 데이터 중 가장 잘 알려진 것이 정부 등 각종 기구에서 공개하는 공공 데이터일 것이다. 공공의 복리를 추구하는 많은 기관에서는 데이터를 공개해 왔지만, 최근 데이터 공개에 대한 인식이 확산됨에 따라 점차 많은 기관이 데이터 공개에 동참하고 있다. 우리가 관심을 가질만한 대부분의 영역에 공공기관이 존재하기 때문에, 사실 공공 데이터를 잘 활용하면 다양한 데이터를 손쉽게 구할 수 있다.

공공 데이터의 특성상 사회 문제를 다루기에 적합하다. 이번에 다룰 주제는 우리 나라의 자살률이다. 미국에 2007년부터 거주하고 있는 필자는 우리나라가 자살률이 전세계에서 1위라는 보도를 접할 때마다 가슴이 철렁하곤 했다. 자살은 개인이 내릴 수 있는 선택 가운데 가장 극단적인 만큼, 우리 사회의 어두운 단면을 반영한 결과일 것이라는 생각에서 였다. 이런 개인적인 관심을 데이터로 풀어보는 것이 이 글의 목적이다.

주제의 특성상 이번 데이터 분석은 복잡한 현상을 다양한 관점에서 들어다보는 탐험적 분석의 성격을 띤다. ‘우리 나라의 높은 자살률’이라는 현상에는 수많은 단편이 있을 것이다. 이런 단편중 문제의 핵심이 되는 부분을 골라서 심층 분석하고, 이를 통해 문제의 본질에 가까이 가는 것이 목표다. 이 과정에서 다양한 공개 데이터가 필요하기에, 이런 데이터를 찾고 활용하는 방법을 배우는 데도 의의가 있다.

우리 나라의 자살율은 정말 세계 1위일까?

우선, 문제가 되는 OECD의 자살률 통계를 실제로 찾아보자. OECD 데이터 홈페이지 (https://data.oecd.org)에 가서 suicide를 검색하면 첫번째 결과로 자살률(suicide rate)을 찾을 수 있다. 실제로 2012년 통계에 따르면 한국의 자살률이 리투아니아와 함께 1위로 나온다. 사실이 아니기를 바랬는데, 엄연한 사실이었다.

자살률의 연도별 변화 추이를 확인하기 위해서는 타임(Time) 슬라이더를 조정해서 1990년부터 2012년까지의 자살률을 다음과 같이 선택해보자. 이를 통해 국가별/년도별 자살률의 변화 추이를 볼 수 있지만, 결과가 모두 회색으로 표시되어 제대로 구분되지 않는다. 이제 몇개의 국가를 선택하여 자살률을 비교해 보자. 필자는 한국과 헝가리, 그리고 일본을 선택했다.

일본의 자살률은 90년대 후반 증가하였지만 정체기에 접어들었고, 헝가리의 경우 꾸준히 낮아지고 있는데 반해, 우리 나라의 자살률은 꾸준히 증가하고 있는 것을 볼 수 있다. 1998년 경제위기와 맞물려 큰 폭의 증가가 있었고, 2000년대 이후에도 계속 증가하는 추세다. 정말 뭔가 문제가 있는 것이다. OECD는 성별 자살률 통계도 제공하고 있으니, 이번에는 남녀로 나누어 데이터를 살펴보자. 아래는 남녀로 나누어 알아본 국가별 자살률의 변화 추세다. (왼쪽: 남자 / 오른쪽: 여자)

각 국가의 남녀별 자살률 트렌드가 상당히 다른 것을 알 수 있다. 헝가리의 경우 여성의 자살률 감소가 두드러지고, 일본의 경우 여성의 자살률은 1998년 잠깐 증가한 이래로 비슷한 수준을 유지하고 있다. 놀랍게도 우리나라의 성별 자살률은 2000년 이후로 여성이 훨씬 큰 폭의 증가율을 보이고 있다. 그 결과 2012년 우리나라 남성의 자살률은 다른 국가들과 비슷한 수준인 반면 여성의 자살률은 다른 국가와 큰 차이를 보이고 있다. 도대체 무슨 일이 일어난 것일까?

자살의 다양한 단면들

이제 자살률이 이렇게까지 증가한 원인을 파해쳐 보자. 우리나라의 자살률에 대한 자료를 찾다 보면 위키피디아의 관련 페이지(https://en.wikipedia.org/wiki/Suicide_in_South_Korea)를 찾을 수 있다. 다양한 연구자료에 근거하여 작성된 이 페이지에 따르면 실제로 우리 나라의 자살률이 급증한 배경에는 노년층 및 여성의 자살 증가가 큰 요인이었음을 알 수 있다.

모방에 의한 자살

그런데 이 페이지에서 언급한 자살률 증가의 원인 가운데 ‘유명인의 자살에 따른 모방’이 등장한다. 이에 관련된 논문이^[Fu, King-Wa, C. H. Chan, and Michel Botbol. “A Study of the Impact of Thirteen Celebrity Suicides on Subsequent Suicide Rates in South Korea from 2005 to 2009.” PLoS ONE, 2013, E53870.] 있어 한번 읽어보기로 했다. 2005년부터 2009년까지 발생한 유명인의 자살 13건이 사회 전체의 자살률 변화에 끼치는 영향을 다룬 이 논문에 따르면 실제로 그중 세건의 자살은 계절 및 실업률 등 다른 요인을 고려한 후에도 자살률에 유의미한 증가를 가져왔다고 한다.

논문에 등장하는 아래 차트에서는 유명인의 자살이라는 사건들이(수직 점선으로 표시) 주간 자살률 트렌드에 어떤 영향을 나타내는지 보여준다. 실제로 2005년 초, 2007년 초, 그리고 2008년 말에 있었던 유명인의 자살 이후 자살률이 확 치솟는 것을 볼 수가 있다. 그리고 유명인의 자살이 잇달았던 2009년은 OECD 통계에서 우리나라 여성의 자살률이 정점을 찍었던 해다.

그렇다면 실제로 어떤 계층의 자살률이 증가한 것일까? 유명인의 자살에 대한 모방이라면 아무래도 젊은 층에서 두드러지게 나타났을 가능성이 높아보인다. 이를 확인하기 위해서는 성별, 연령별 자살률 데이터가 필요하다. 그리고 통계청에서 운영하는 국가 통계 포탈 사이트 KOSIS(http://kosis.kr/)에서는 이 데이터를 찾을 수 있다. 아래는 KOSIS 홈페이지에서 ‘자살’을 검색한 결과다.

여기서 ‘전국 주요사인별 사망률’을 선택하면 관련 통계자료를 볼 수 있다. 우리가 관심을 갖는 여성의 연령별 자살률을 보기 위해서는 ‘일괄설정’ 메뉴로 들어가 다음과 같이 선택을 하면 된다.

선택을 완료한 후에 ‘적용’을 누르면 기간별 연령대별 여성의 자살률을 표 형태로 볼 수 있다. 좀더 한눈에 들어오는 결과를 보기 위해서는 표 오른쪽 위의 차트 버튼을 눌러 시각화를 본다. 결과적으로 다음과 같은 차트를 볼 수 있다. 연도별 그래프의 가장 왼쪽의 막대는 10대 초반 여자의 자살률을 나타내며, 오른쪽으로 갈수록 더 높은 연령대의 자살률을 보여준다. (년도별 막대의 가장 오른쪽은 80대 이상의 자살률)

위 차트에서는 실제로 2005년부터 젊은 여성의 자살률이 급증한 것을 볼 수 있다. 이런 현상이 연예인들의 자살에 기인한 결과라고만 볼수는 없지만 세대별 자살률의 분포를 완전히 바꾸어 놓을 정도로 큰 변화가 생긴 것이다. 젊은 여성의 자살률은 2012년부터 조금 진정되는 모습을 보이지만 아직도 2003년과는 다른 추세를 보인다.

(주: 같은 기간에 남성의 자살률을 보면 나이 증가에 따라 자살률이 증가하는 추세를 볼 수 있다)

장년층의 자살

이번에는 조금 시계를 되돌려 1998년 IMF위기에 나타났던 자살률 증가의 원인을 살펴보자. 위와 같은 방식으로 1995년부터 2000년 까지 성별 연령별 자살률의 분포를 알아본 결과는 다음과 같다. (위: 남성 / 아래: 여성)

위 그래프에서도 1998년 남자 장년층의 자살률이 갑자기 급증하는 것을 볼 수 있다. 여성 장년층의 경우도 얼마간 영향을 받았지만 그 정도는 상대적으로 미미하다. 다시금 그 시대를 가장으로 살아야 했던 우리 아버지 세대의 무거웠을 짐이 느껴지는 순간이다.

노년층의 자살

마지막으로 지금까지 살펴본 자살률 트렌드를 좀더 거시적인 관점에서 살펴보자. 아래 그래프는 1990년부터 2013년까지의 성별 세대별 자살률의 분포다. (위: 남성 / 아래: 여성 / 각 그래프의 가장 아래는 10대 초반, 가장 위는 80대 이상)

위 그래프에서는 위에서 살펴보았던 1998년 남자 장년층의 자살률 급증, 그리고 2005년부터 시작된 젊은 여성의 자살률 증가가 뚜렷히 드러난다. 하지만 가장 뚜렷한 트렌드는 노년층의 자살률 증가다. 1990년만 해도 다른 세대에 비해 그다지 높은 자살률을 보이지 않았던 노년층의 자살률은 해가 갈수록 급증하는 추세를 보이다가 2002년 이후는 다른 연령 집단의 자살률을 압도하는 수준을 보인다. 도대체 무슨 일이 벌어진 것일까?

각종 보도자료에 따르면 이런 현상의 배경에는 우리 사회의 여러 변화가 자리하고 있다. 사회의 핵가족화 등의 많은 어르신들은 자식들과 격리되어 쓸쓸한 여생을 보낸다. 여기에 더하여 황혼 이혼도 증가했다. 그리고 특히 변변한 벌이도 없는 상황에서 경제 불황으로 자식들의 손을 빌리기도 어렵게 되면 자살을 선택하는 어르신들이 많다고 한다. 그야말로 슬픈 현실이 아닐 수 없다.

맺음말

이번 글에서는 공공 데이터를 이용한 탐험적 데이터 분석의 사례로 우리나라의 높은 자살률을 살펴보았다. OECD 통계자료에서 출발하여, 관련 논문 및 통계청 자료를 통해 좀더 성별, 연령별 자살률 증가의 원인을 구체적으로 살펴보았다. 데이터의 유형 및 양에 따라 다양한 시각화 방법을 선택하고, 이를 통해 데이터가 드러내는 추세를 좀더 정확히 살펴볼 수 있다는 점을 알았다.

우리 사회를 어둡게 했던 여러 사건들이 실제로 자살률이라는 구체적인 수치로 확인되는 과정이 오싹하기도 하다. 10년쨰 OECD 국가중 자살률이 1위라는 것은 분명 슬프고 착잡한 현실이지만 데이터를 통해 자살이라는 사회 현상의 원인을 좀더 명확히 이해하는 것이 문제 해결의 첫걸음이라는 생각을 해본다.

공개 데이터셋

이 글에 사용된 데이터셋을 포함하여 다양한 공개 데이터셋을 구할 수 있는 방법을 소개한다.

일반 데이터셋

분야별 데이터셋

국내 데이터셋

데이터 과학에 관한 각종 자료와 더 많은 이야기를 헬로 데이터 과학에서 만나실 수 있습니다. (페이스북 / 트위터)

--

--

Jin Young Kim
Korean Medium Post

Head of Data Science and Director of Naver Search US. (We’re hiring data scientists and engineers in Korea & US!) #헬로데이터과학 #데이터지능팟캐스트