30일 만에 데이터 사이언티스트가 되는 비법

DS School
5 min readFeb 13, 2018

--

하버드 비즈니스 리뷰에서 데이터 사이언티스트를 21세기 가장 섹시한 직업으로 선정한 것을 보면 알 수 있듯이, 데이터 사이언티스트에 대한 관심도가 전세계적으로 매우 높다.

최근 미국 최고 취업 포털인 Glassdoor(미국의 잡코리아)는 3년 연속 최고의 직업으로 데이터 사이언티스트를 선정했다.

중간 연봉이 원화로 무려 1억 2천만원이 넘는다(…)

복잡하고 무서운 데이터 사이언스: 나에게 적합할까?

아무리 연봉이 높다고 해도 데이터 사이언스가 본인과 적합할지 고려해 봐야 한다. 그러기 위해서는 데이터 사이언스를 실제 상황에 적용해보는 과정을 간단하게 살펴보자.

어렵게 보이지만, 아래 글이 흥미롭다면 배워볼만 하다

문제: 타이타닉호의 생존자 예측하기

1912년 타이타닉 침몰 당시 2,204명이 탑승하고 있었다. 그중 약 1500명 사망했고, 700명 정도가 생존했다. 만약 1,102명의 탑승자의 대한 정보와 생존 여부를 공개한다면, 나머지 1102명에 대한 생존 여부를 얼마나 정확하게 예측 할 수 있을까?

주어진 정보

우리에게 주어진 정보는 탑승객의 생존 여부, 티켓 클래스(1등석, 2등석, 3등석), 성별, 나이, 어떤 항구에서 탑승했는지를 포함한 아래의 정보가 주어진다. 넘어가기 전에 잠시 예측해보자. 어떤 탑승객이 생존확률이 가장 높을까?

분석

주어진 정보를 통해 생존율을 어떻게 분석 할 것인가? 각 특성과 생존율을 비교해보면 된다. 남성의 평균 생존율, 여성의 평균 생존율, 나이별 생존율, 1등석의 생존율 등..

엑셀을 통해 각 특성과 생존율을 비교하면 된다

분석 결과

  • 여자는 생존 확률이 훨씬 높다. 타이타닉 영화만 봐도 “여성과 아이들만 탑승하세요"가 기억이 날 것이다.
  • 1등석도 생존율이 높다. 그 이유는 실제 타이타닉호의 배치도가 이렇기 때문이다.
3등석(핑크색)과 2등석(노란색)은 Deck과의 거리가 멀다
  • 아이와 가족이 함께 탑승했을 경우 생존율이 낮다. 가족 없이 혼자 구명 보트를 타지 못한 것이다.
  • 그 외에도 다양한 요소들이 있지만 이건 수업이 아니니깐 여기까지..

데이터 사이언스: 핵심 특성만 선택해주면 인공지능이 정답을 찾아준다

데이터 사이언스에서는 인공지능 분석 프로그램이 내가 특성만 선별해주면 생존율을 자동으로 분석해준다. 난 코딩 몇줄만 입력하면 된다. 생각보다 코딩이 어려운 것보다, 어떤 요소가 결정적인지 분석하는 것이 더 중요하다. 그렇기 때문에 데이터 사이언스에서는 코딩 기술에 앞서 분석적인 사고와 호기심이 필수다. 수업을 통해 보통 약 80% 정확도로 생존율을 예측할 수 있게 된다. 80% 정확도는 데이터 사이언스 대회인 Kaggle 에서도 상위 20%에는 속하게 되는 매우 좋은 정확도이다.

데이터 사이언스에서는 코딩 기술에 앞서 분석적인 사고와 호기심이 필수다.

평소에 분석하는 것을 좋아하는가?

실제 사업과 일터에서 얼마나 다양한 정보를 분석하고 예측할 수 있을지 상상해 봐라.

  • 서비스의 결제 유저들의 행동 분석을 통한 결제 예측/유도
  • 날씨와 요일에 따른 레스토랑 방문 고객 예측
  • 날씨, 온도, 습도에 따른 자전거 대여 예측
  • Airbnb 유저들의 첫 여행 국가 예측
  • 감독, 배우, 작가, 예산에 따른 영화 관객수 예측
  • 폐암 환자 특성 분석을 통한 암 발병률 예측 등

평소에 이런 분석과 예측이 흥미롭고 궁금하다면 데이터 사이언티스트가 될 수 있는 충분한 자격이 있다고 할 수 있다.

어디서부터 시작할 것인가?

시중에 다양한 책들이 있지만 혼자 공부하면 적어도 6개월 이상은 헤매야 한다. 요즘 국내에서 다양한 데이터 사이언스 강의들이 있는데, 그 중 DS School은 철저한 실습형으로 최근 1,100명의 수강생을 배출했다. 타사보다 약 50% 저렴한 50만원과 4주동안 5시간만 투하자면 입문반을 수강 완료 할 수 있다.

>> https://dsschool.co.kr/

강의 평균 만족도 4.9/5.0인 만큼 수강 후기가 매우 좋다

처음 새로운 분야에 입문할때 어떤 부분이 중요하고 실제 실무에서 사용하는지 모르기 마련이다. 그렇기 때문에 처음에 방대한 사전적인 정보를 배운 후에 중요한 정보를 추리는 과정을 거치게 된다. 이런 과정은 시간이 많이 걸리고 공부의 양도 많아지기 마련이다. 하지만 DS School의 장점은 매우 뛰어난 강사님이(이미 국내 최대 수강생인 1,300명을 가르치셨다) 실무에서 바로 사용할 수 있는 부분들을 실습위주로 학습 해줌으로, 비전공자가 코딩을 몰라도 쉽게 데이터 사이언스를 배우고 습득할 수 있다는 점이다. 그렇기 때문에 수강 후기가 이렇게 좋다.

수강 후기 더 보러 가기 https://www.facebook.com/pg/dsschoolkorea/reviews/?ref=page_internal

당신도 30일만에 데이터 사이언스를 입문 할 수 있다

비전공자도 가능하다. 설날 기념으로 50% 할일을 하고 있으니, 커리큘럼을 확인해보자.

컬리큘럼 더 알아보기 > https://dsschool.co.kr/

--

--