현대카드 사장의 말뿐인(?) 빅데이터론

듣기엔 그럴 듯…But 인프라가 없다


지난 2014년 12월에 이어 최근 정태영 현대카드 사장의 빅데이터론이 화제가 되고 있습니다. 국내 빅3 카드사인 현대카드의 수장이자 소셜네트워크서비스(SNS)의 높은 영향력 때문인데요. 최근 그가 게재한 빅데이터 관련 글이 또 다시 주목을 받았습니다.

트렌드
Big Data : Big Data의 흔한 오류는 ‘많이 쌓여 있는 데이터를 더 정밀하게 분석하겠다’는 생각이다. 멋있게 들리지만 막연하고 과도한 데이터의 창고에서 진전이 없다. 성공사례도 많이 없다.
Data로 성공하는 회사들은 순서가 꺼꾸로이다. 사업을 정하고 거기에 어떤 data가 필요한지 정하고 그 data를 안정적으로 구하는 방법을 연구한다. 그래서 다루는 data도 생각보다 많지 않다. 진정한 Big Data이다.
Behavioral Data : 기술혁신으로 입수가 풍부해진 behavioral data를 기존의 데이터 위에 반영하는 것이다. 많은 data가 아닌 핵심적 data를 추려야 한다. 예를 들어 쇼핑시간과 식사시간으로 사무직과 자유직을 추정하거나 인스타그램 유저에게는 사진 위주의 안내를 제공하는 식으로. — 정태영 현대카드 사장 페이스북

정태영 사장은 기존 빅데이터 접근론에 의문을 품으며 ‘행동 데이터(Behavioral Data)’라는 키워드를 제시합니다. 현대카드의 경우는 지난 2012년 12월부터 세 차례 빅데이터 프로젝트를 진행하고, 결과를 발표했는데요. 수장으로서 지난 프로젝트를 평가한 게 아닐까 싶습니다.

그런데

상당수의 사람들(특히 IT업계 종사자)이 반론을 제기하고 있습니다. 빅데이터 프로젝트를 해본 경험에 기반한 평가를 놓고 비판의 목소리가 끊이지 않는 이유는 뭘까요.

이론은 있으나 ‘액션’이 없기 때문입니다.

개인적으로 알아본 결과 현대카드의 빅데이터 프로젝트는 CLM(Customer Lifecycle Management)실에서 합니다. CLM실에서는 고객의 카드 이용 패턴을 분석해 편의점 같은 곳에서 현대카드로 결제시 쿠폰이나 혜택이 담긴 문자메시지 제공 서비스를 담당하는 부서인데요. 데이터 분석을 통해 마케팅적인 인사이트를 만든다는 게 골자였습니다. 아니면 소셜(SNS) 쪽에서 이야기하는 메시지를 조금 들여다보는 정도였죠.

문제는, 이러한 고객관리가 수작업으로 이뤄진다는 점입니다. 현대카드는 이러한 비정형 데이터에 대해 담당 직원들이 개별적으로 ‘모니터링’해서 특이사항이 발생할 때마다 보고하고 있는 게 전부라고 들었습니다. 즉, 데이터화해서 처리하지 않고 있다는 겁니다.

<첨언> 하둡(Hadoop)이나 NoSQL 등의 비정형 데이터를 담을 수 있는 인프라를 구축하기보다는 기존 관계형데이터베이스(RDBMS)에서 정형화된 트랜잭션 데이터만 처리하다보니 한계점이 있었을 거라는 생각도 듭니다. 물론, RDBMS가 뒤처졌단 의미는 아닙니다. 

정태영 사장의 멘트에 반론이 붙는 이유는 데이터에 깊게 접근하지 못한 상태에서 프로젝트에 ‘빅데이터’를 붙였고, 2~3년 뒤에 무용론을 이야기했기 때문일 겁니다.

몇 해 전 대부분 카드업체가 도입한 고객관계관리(CRM) 기법과 빅데이터의 차이를 모르겠다. 빅데이터가 미래를 책임질 신사업이라는 시각은 너무 앞서 나간 것이다. 시장 수요는 없는데 공급자들이 요란하게 소리를 내는 게 빅데이터 사업의 현주소다. — 정태영 사장의 2014년 12월 빅데이터 관련 발언(한국경제)

사실, 기업의 수장이 빅데이터 관련 기술, 인프라를 모두 알 필요는 없죠. 본인은 기술에 문외한이라면서 빅데이터를 강조하는 인물이 한 명 더 있습니다. 그런데 많은 사람들이 이 인물의 발언에는 박수를 치고 동의하죠. 그게 누구냐면…

알리바바 그룹 창업주인 마윈입니다. 마윈이 빅데이터와 관련해 하는 이야기는 철학적이다 못해 형이상학적입니다.

IT기술과 데이터기술의 차이는 정말로 큽니다. 데이터 기술의 핵심 역시 인터넷, 이 시대의 최고 놀라운 것입니다. 다른 사람이 당신보다 중요하고, 똑똑하며, 일을 더 잘하고, 성공하는 이타주의를 의미합니다. (그들이 성공한 다음에야) 당신이 성공하는 것이죠. — 마윈
IT技术和Data技术是有巨大的差异,Data技术的核心,也就是互联网这一世纪最了不起的东西,利他主义,相信别人要比你重要,相信别人比你聪明,相信别人比你能干,相信只有别人成功,你才能成功。- 马云
-> 마윈의 Data Technology?

마윈은 빅데이터와 클라우드의 중요함을 강조하며 ‘이타주의’를 말합니다. 그럼에도 그의 말은 비판받지 않습니다. 돈을 잘 벌어서일까요? 아닙니다. 그렇게 따지면 현대카드도 국내에서는 세련되단 이미지를 갖고 있습니다.

마윈의 말이 힘을 얻는 이유는 구체적인 빅데이터 활용 사례와 인프라가 뒷받침하고 있기 때문입니다.

타오바오의 이미지 데이터는 다양하면서도 방대하다. 그러나 동시에 각 판매자별로 이미지를 만들어 올리는 만큼 다 달라서, 복잡하고 처리하기 어렵다. 이미지에 붙는 상품정보 역시 판매자의 불성실 영향을 받아 부정확할 수 있다.
구체적으로 활용된 기술은 ▲복잡한 배경 속에서 의류를 감지하는 디텍션 ▲방대한 데이터를 처리하는 딥러닝 플랫폼 ▲유사한 옷을 찾기 쉽도록 하는 로컬 시밀러리티 매칭 기술 ▲고차원 데이터에 대한 인덱싱과 복구(Retrieval) 등이다. 인덱싱과 복구 성능을 높여야 하는 이유로 매일 달라지는 데이터 업데이트를 들었다. — 알리바바, 딥러닝 기반 이미지 검색 구현(ZDNet Korea)

알리바바 그룹의 고객 간 거래(C2C) 전자상거래 플랫폼인 ‘타오바오’의 사례인데요. 이들은 빅데이터를 자사의 시스템에 어떻게 도입하고 있는지 인프라단에서부터 공개하고 있습니다.

저는 정태영 사장의 빅데이터론 자체를 비판할 생각은 없습니다(사실 그간 현대카드가 해온 프로젝트가 빅데이터와 무슨 관련이 있는지는 잘 모르겠긴 하지만요…). 하지만 그의 주장과 생각이 힘을 얻기 위해서는 현대카드가 그간 빅데이터 프로젝트를 위해 ‘회사가 보유하고 있는 데이터를 어떻게 활용했는지’ ‘인프라는 무엇인지’ ‘데이터를 통한 결과 도출 과정’ 등 구체적인 사례가 뒷받침돼야 할 겁니다.