Data? Data!

Seungmook Lee
2 min readSep 30, 2021

--

최근 가장 많이 듣게 되는 것 중에 하나가 “데이터에 기반한…”이라는 말 이다. 사업계획서를 작성하든지 아니면 과제보고서를 작성하든지 만능열쇠처럼 사용되고 있다. 요즘에는 거기에 덧붙여 “AI에 기반한…”이라는 말도 같이 쓰이고 있다. 그만큼 데이터라는 것이 중요하다는 의미일텐데, 현업에서 얼마나 많이 실제 데이터롤 적용해서 문제를 풀고 있을까?

데이터 또는 분석 관련 인기가 높아지면서 데이터 분석이 가능하다는 많은 사람들을 만나게 된다. 실제 어느 정도는 맞는 이야기이다. AutoML 또는 많은 모델들의 구현이 쉬워지면서 많은 사람들이 주어진 안내대로 데이터를 setting하고 모형을 적합하는 코드를 짜서 결과를 얻어낸다. 하지만 나온 결과를 제대로 이해하고 해석하면서 현업에 적용하여 문제를 해결하는 사람들은 그리 많지 않은 것 같다. 태생적으로 모델 또는 알고리즘들은 assumption을 가정하고 문제를 푼다. 따라서 가정을 잘 보고 주어진 데이터에 잘 맞는 모형을 그리고 알고리즘을 적용해야 한다.

예전에 영국의 정치가인 레너드 코트니(Leonard H. Courtney)는 “거짓말에는 세 종류가 있다. 거짓말, 새빨간 거짓말, 그리고 통계다.”라는 말을 했다고 한다. 하지만 이 말은 잘못 되었다. 통계는 또는 데이터는 거짓말을 하지 않는다. 단지 데이터와 통계를 이용하는 사람이 (어떤 의도를 가지고 또는 무지에 의해) 거짓말을 한다.

결론…. 데이터를 “정말로” 적합한 방법으로 제대로 사용하자. ^^

--

--