제 4차 DSC 대회 우승자 인터뷰 (직방 주최)
3월, ‘데이터 사이언스 경진대회(Data Science Competition 2018–19, 이하 DSC)’ 운영사인 데이콘(Dacon)은 국내 최대 부동산 정보서비스 ‘직방’과 함께한 제 4차 대회의 수상자 인터뷰를 진행했습니다. 4차 대회 최종 우승자들에게는 총 8,000 달러의 상금이 수여되었는데요, 대회 우승자들의 소감 한번 들어보실까요?
*ZPER = Data Science Competition (DSC) 대회 주관사
제 4회 ‘직방’ 대회 수상자 인터뷰
1위 김웅곤(통계청), 양경성, 민성욱, 김현우(EDA)
Q. 수상을 진심으로 축하드립니다. 수상소감을 말해주세요.
김웅곤) 저는 통계청에서 근무하는 직장인입니다. 머신러닝, 인공지능 기법이 국가통계조사에 도입되면 좋겠다는 생각에 머신러닝, 인공지능을 열공하는 와중에 부동산 예측 대회 우승이라는 쾌거를 이루어 대단히 만족스럽습니다. 모두 현업에 종사하느라 힘들지만 대회에 전념해주신 팀원분들과 퇴근 이후에도 코딩할 수 있게 신혼임에도 항상 응원해준 와이프, 좋은 대회의 장을 마련해 주신 Dacon에 감사를 전합니다.
양경성) 이미지 인식만 해오다 정형 데이터로 영역을 확장하는 계기가 되었고 수상까지 하게 되어 매우 기쁩니다.
민성욱 & 김현우) 모든 팀원분들 고생 많으셨습니다.
Q. 데이터 분석에 관심을 가지게 된 계기나 데이터 분석 일을 하게 된 이유가 있다면 무엇인가요?
김웅곤) 대학생 때 수학과 경영학을 전공했으며, 경영학을 전공하면서 수많은 경제 금융 데이터를 다루어 본 경험이 있습니다. 그리고 수학을 전공하기도 했고. 어릴 적부터 코딩을 취미로 즐기곤 했었습니다. 어릴 때 컴퓨터 많이 한다고 매일 혼나기도 했습니다 (웃음)
이런 과정들이 융합되어 자연스럽게 데이터 분석에 흥미를 가지게 되었으며 대학원에 가서 통계에 대한 깊은 공부를 더 해보려다가 갑자기 생계유지가 중요하기도 했고 전국 단위의 데이터 분석이라는 것을 제대로 체험해보고 싶어서 졸업 전에 ‘통계청’이라는 글자만 보고 바로 통계청에 지원하여 입사하여 데이터 관련 업무를 맡게 되었습니다.
김현우) 취업을 하려고 진로에 대해 고민하다 보니 데이터 분석이 재미있기도 하고 적성에 맞아 대회에 참여하게 되었습니다.
Q. 데이콘 경진대회에 참가한 동기가 있나요?
김웅곤) 한국인공지능아카데미에서 만나 딥러닝 기반 알츠하이머 연구 논문을 같이 쓰며 인연이 된 양경성 부장님과 데이터 사이언스 대회 고수 김현우 군의 권유로 직방 부동산 예측 대회에 참여하게 되었습니다.
향후 기회가 된다면 비정형데이터 정형 데이터 가리지 않고 온갖 종류의 데이터 분석에 특화된 업무를 맡아 보고 싶으며, 이와 같은 이유로 분석 실력을 키워 보기 위해 데이콘 경진대회에 참가하게 되었습니다.
양경성) 다양한 배경을 가진 사람들이 협업하면 경쟁력이 있겠다고 생각되어 팀을 만들게 되었고, 한국의 아파트 가격에서 가장 중요한 요인이 무엇인지 너무 궁금해서 참가하게 되었습니다.
Q. 학업, 현업, 일상생활 등과 관련해서 대회 중 느낀 점은 무엇인가요?
김웅곤) 직장에서 하루 종일 코딩하다가 퇴근 후 대회 관련하여 새벽까지 코딩 하고 만든 모델을 계속 실험하여 결과를 기다리는 것이 체력적으로 큰 부담이 되었습니다. 이 과정에서 건강의 소중함을 느꼈으며, 얼마 전부터 운동을 하기 시작했습니다. 데이콘 대회에 참가하면서 수많은 모델을 실험해보았으며, 어떤 모델은 잘 되고 안 되는 이유를 항상 고민하며 대회에 전념하였는데, 이를 통해 얻은 깨달음이 큰 자산이 되어 실무에서 큰 도움이 되고 있습니다.
Q. 대회 참가 기간 동안 어려운 점은 있었다면? (일정 관리, 분석 방법론 등)
김웅곤) 신혼이라 가정에 충실해야 하는데 데이터 대회에 충실하는 것이 상당히 어려웠습니다. (웃음)
김현우) 데이터 자체에 노이즈가 많았는데 이를 걸러낼 수 있는 방법을 찾아내지 못한 게 아쉬웠습니다.
민성욱) 모델을 돌릴 때마다 이따금 부동산에 관련한 통념과 다른 결과가 나오는 것이 상당히 어렵게 느껴졌습니다.
2위 Story (계정 아이디)
Q. 수상을 진심으로 축하드립니다. 수상소감을 말해주세요.
A) 두 달 반 동안 짧다면 짧고 길다면 긴 시간이었지만, 고생한 만큼 정말 보람찬 경험이었습니다. 데이터 사이언스에 대해 전반적인 지식이 부족했지만, 여러모로 공부해가면서 성과를 내니 정말 기분이 좋습니다.
Q. 데이터 분석에 관심을 가지게 된 계기나 데이터 분석 일을 하게 된 이유가 있다면 무엇인가요?
A) 우연한 계기로 빅데이터 수업을 들었는데, 데이터 분석을 통해 인사이트를 발견하고, 예측하는 것이 굉장히 매력적으로 다가왔습니다. 또한 공부를 거듭할수록 앞으로 발전 가능성이 크다고 느꼈습니다.
Q. 데이콘 경진대회에 참가한 동기가 있나요?
A) 빅데이터 수업하는 동기끼리 프로젝트를 진행하면서 참여할 공모전을 구하다가 아파트 가격 예측이 가장 재미있을 것 같아서 참여하게 되었습니다.
Q. 학업, 현업, 일상생활 등과 관련해서 대회 중 느낀 점은 무엇인가요?
A) 미래를 예측하는 것은 역시 어렵다는 것을 느꼈습니다. 과연 우리가 만든 모델을 이용해서 부동산 투자를 한다고 했을 때, 집값에 대한 오차가 이렇게 벌어진다면 수익성을 얼마나 보장이 될지 생각해 보았는데, 앞으로 더욱 공부를 열심히 해서 보다 정확하고 유용한 분석을 하고 싶다는 생각이 들었습니다.
Q. 대회 참가 기간 동안 어려운 점은 있었다면? (일정 관리, 분석 방법론 등)
A) 모델을 학습하는 과정에서 연산량이 굉장히 많은데, 이를 빠르게 돌릴만한 장비를 구하기가 매우 어려웠습니다. 만약 보다 좋은 장비가 있었다면 오차를 더 줄일 수 있었을 터라고 생각하곤 했습니다.
Q. 향후 데이콘 대회에 바라는 점이 있다면?
A) 보다 다양한 주제의 프로젝트를 다루고 싶습니다. 하루당 제출 횟수가 많으면 보다 좋은 성능을 내기 편할 것 같습니다.
3위 Ryan (계정 아이디)
Q. 수상을 진심으로 축하드립니다. 수상소감을 말해주세요.
A) 2번째 수상을 하게 되어 매우 기쁩니다. 2번째 수상을 하게 되어 너무 좋습니다. 좀 더 자신감을 얻게 되었네요! 함께한 팀원에게 너무나 감사드립니다.
Q. 데이터 분석에 관심을 가지게 된 계기나 데이터 분석 일을 하게 된 이유가 있다면 무엇인가요?
A) 야구에 대한 관심이 높아서 세이버메트릭스를 공부하다가 데이터에 빠지게 되었습니다. 공부, 용돈, 재미 등의 요인으로 데이터 분석에 관심을 두게 되었습니다.
Q. 데이콘 경진대회에 참가한 동기가 있나요?
A) 3회 대회에도 참여했었는데 문제가 비슷해 보여서 이번 대회에도 참가하게 되었습니다. 3차 대회와 비슷한 문제여서 다시 도전하게 되었습니다.
Q. 학업, 현업, 일상생활 등과 관련해서 대회 중 느낀 점은 무엇인가요?
A) 학업과 대회 준비를 병행하기가 너무 어려웠습니다. 점점 다들 실력이 좋아지는 거 같더군요. 순위를 지키기 위해서 잠을 포기하게 되더군요.
Q. 대회에 참여 중 어려운 점은 있었다면? (일정 관리, 분석 방법론 등)
A) 데이터가 커서 분석하는데 많은 시간이 소요되어서 힘들었습니다. 3차와 비슷하긴 했어도, 데이터 크기, 복잡도가 좀 더 커져서 쉽지 않았네요.
Q. 향후 데이콘 대회에 바라는 점이 있다면?
A) 포인트 제도가 필요해 보입니다.