2020년에 데이터 사이언스를 배워야 하는 이유

이 글은 원문 Why learn Data Science in 2020? by Jaime Zornoza을 저자의 동의하에 번역한 글입니다. 흔쾌히 번역에 동의해 주신 저자 Jaime Zornoza 님께 감사의 말씀을 드립니다.

Image from Unsplash.com.

데이터 사이언스, 빅데이터, 머신러닝, 인공지능. 전부 강한 파급력을 지닌 단어들이다. 실제 분석, 통계, 그리고 이미지 자료를 통해서 우리가 왜 이 분야에 대해 배워야 하는지 알아보도록 하자.

Why learn Data Science or Machine Learning?

하버드 비즈니스 리뷰(HBR)는 데이터 사이언스를 ‘21세기의 가장 섹시한 직업’으로 선정했다. 유명 채용 사이트인 글래스도어(Glassdoor)는 데이터 사이언스를 2019년 미국 최고의 직업으로 공개했다. 블룸버그(Bloomberg)는 데이터 사이언티스트를 떠오르는 슈퍼히어로라 말한다.

데이터 사이언티스트, 머신러닝 엔지니어, 데이터 엔지니어. 이 세 직업은 모두 두 가지 공통점을 지닌다. 요즘 제일 매력적인 직업이고, 전부 데이터를 다루는 직업이다.

- The Demand -

최근 몇 년 동안 이러한 직종의 수요가 급상승했고, 다음 자료에도 보이듯 앞으로도 꾸준히 성장할 추세이다.

데이터 사이언티스트 수요의 증가. Source.
데이터 사이언티스트 수요의 증가. Source.

데이터 관련 직종의 디맨드가 굉장히 크다 보니, 이런 분야에 충분한 지식을 가진 사람이라면 다양한 분야에서 취업 기회를 찾을 수 있다.

에너지 마켓에 관심이 있다면? 에너지 마켓의 유명 회사들은 좋은 결정을 내리고 효율성을 높이기 위해 데이터 기반(data-driven) 인재를 원한다.

컨설팅을 즐긴다면? 맥킨지, 배인, BCG와 같은 대기업은 클라이언트의 데이터를 활용할 수 있는 데이터 사이언티스트와 데이터 엔지니어들을 모집한다.

테크 회사에서 일해보고 싶다면? 구글, 아마존, 우버, 페이스북을 포함한 모든 회사들이 데이터 마법사(Data Wizards)를 찾고 있다.

- The Salaries -

글래스도어(Glassdoor)에 의하면 미국 데이터 사이언티스트의 평균 연봉은 $117,345(한화로 약 1억 4000만원)이다. 미국 평균 연봉보다 훨씬 높은 값으로, 비슷한 직군에 있는 직업의 연봉도 높은 편이다.

직업들의 평균 미국 연봉. Source.

- The Beauty -

수요와 연봉을 전부 떠나서, 이런 직업은 자율 주행 자동차(Autonomous Vehicles)나 영상 인식(Advanced Image Recognition)처럼 모든 분야에 혁신을 주는 기술을 구현하는 작업을 한다. 때문에 산업계와 학계의 다양한 발전의 중심에 있을 것이다.

인공지능 (AI) 마켓은 2025년까지 $36 billion (한화로 약 43조 원)의 수익이 예측될 정도로 가장 큰 성장세와 혁신이 일어나는 시장 중 하나이다.

인공지능 (AI) 마켓의 수익. Source.

데이터 사이언스가 불러오는 모든 발전은 우리 사회에 유익한 영향을 끼치기 때문에, 관련 있는 어떠한 분야에서 일하던 세상과 삶의 질에 큰 임팩트를 준다고 여길 수 있다. 인공지능으로 너무나도 다양한 일을 할 수 있고, 하게 될 것이며, 데이터를 다루는 사람들이 우리의 미래를 그려나갈 것이다.

결론적으로 데이터 사이언스, 머신러닝, 그리고 그 외 관련 일들은 전부 흥미롭고, 재밌고, 끝없는 응용이 가능한 아주 유망한 분야이다.

수습생(Practitioner)이 많음에도 불구하고, 이 분야에서 실질적인 자격을 갖춘 전문가들은 부족한 상태다. 당신도 전문가가 된다면 의미 있고 도전적인 일들이 당신을 기다리고 있을 것이다.

Okay, but why is this all happening now?

머신러닝은 사실 새로운 분야가 아니라 20세기부터 시작했다. 데이터 사이언티스트도 다른 이름으로 존재해왔다.

So why now? 왜 최근 몇 년간 이런 직종의 수요가 늘어났을까? 크게 두 가지 이유가 있다:

1. 만들어지고 사용되는 데이터의 양이 부쩍 증가했다. 매일 더 많은 센서들이 온갖 정보를 수집하고, 종일 스마트폰을 들고 돌아다니는 우리도 데이터의 큰 소스 중 하나이다. 인터넷의 꾸준한 성장세 또한 커져가는 데이터 양에 기여했다.

데이터 양의 예측. Source.

현재 그 어느 때보다 더 많은 데이터가 만들어지고 있다. 이 데이터는 분석되지 않거나, 비즈니스 혹은 조직에 가치를 주지 않는다면 무의미하다. 데이터가 제대로 사용된다면 더 현명한 결정, 자동화 발전, 뛰어난 통찰력, 그리고 그 외에 다양한 일들을 가능하게 할 것이다.

때문에 데이터를 잘 활용하고 최대한의 잠재력을 끌어올릴 수 있게 하는 사람들의 필요가 최근 몇 년간 급격하게 증가했다.

2. 컴퓨터 성능의 발전으로 현실적으로 가능한 시간 안에 많은 데이터로 결과를 도출해 낼 수 있는 효율적인 시스템 개발이 가능해졌다.

Moore’s Law graph for Density of devices 1970–2020. Source.

전 세계 어디서든 빅 클러스터(big clusters)나 머신에 지능적인 솔루션을 만들고 활용할 수 있게 도와주는 AWS, Cloudera, Microsoft Azure와 같은 플랫폼인 클라우드 컴퓨팅은 인공지능 시스템의 가능성을 향상시킨다.

Can I really learn enough to build a career?

당연히 가능하다. 이 분야에서 일하기 위해 필요한 빌딩 블록을 배울 수 있는 수백만의 온라인과 오프라인 자료들이 있다.

프로그래밍을 할 줄 모른다면? 걱정할 필요 없다. 상상도 못 할 만큼 배울 수 있는 곳이 넘쳐나고, 솔직하게 말하자면, 머신러닝 모델을 만들고 사용하기 위해서 프로그래밍을 마스터할 필요까진 없다.

수학이나 대수학을 모른다면? 괜찮다! 탄탄한 수학 배경을 가지고 있다면 도움이 되겠지만, 기본적인 수학 지식만 있다면 충분히 살아남을 수 있다. 프로그래밍과 마찬가지로 더 배우고 싶다면 좋은 책과 자료들은 쉽게 찾을 수 있다. 확률과 통계를 알아둬도 다양하게 활용 가능하고, 배우는 것도 그리 어렵지 않다.

데이터 사이언스나 머신러닝에 대해 모른다면? 모든 아기가 태어나면서부터 걷진 않는다. 다른 일들과 마찬가지로 이 분야 또한 책을 통해, 온라인 수업이나 프로그램으로 독학하던, 대학교와 대학원 프로그램의 도움을 받건, 다양한 과정을 통해서 배우면 된다.

매일 더 많고 다양한 프로그램이 제공되고, 자료의 양도 무한하다. 하지만 자료의 양이 방대하다 보니 가끔 좋은 자료와 나쁜 자료를 구분하기 어려울 수 있기 때문에 신중하게 선택해야 한다.

이 포스트의 목적은 좋은 자료를 추천하거나 어떠한 방식으로 배워야 하는지 알려주는 것은 아니지만, 관심 있다면 얼마든지 아래 남긴 주소로 연락해도 된다. 도움 주는 데 최선을 다하도록 하겠다. (역주: 데이터 사이언스 공부를 시작하는 방법은 이 블로그 글을 읽어보세요!)

Closing Words

늘 그렇듯, 이 포스트가 흥미로웠길 바라며, 많은 사람들이 데이터 사이언스나 머신러닝에 더 관심을 가졌으면 좋겠다!

--

--