음성인식 기술의 사회 자산화 검토가 필요하다.


인공지능과 산업에 대해서 설명하기 전에 인공지능은 무엇인가?에 대해서 정리해 보겠다. 또한 기술 유관 종사자가 아니더라도 이해가 쉽도록 용어의 사용을 제한하도록 하겠다. 인공지능이라는 표현은 관점에 따라 다른 의미를 가지는데 크게 두 가지로 구분할 수 있다. 첫 째, 미리 사람이 설정한 기준대로 기계가 알아서 동작 하면 인공지능이다. 예를들어 실내 온도와 습도를 사용자가 설정한 기준대로 자동으로 조절해 주는 것이 인공지능에 해당한다. 둘 째, 사람이 미리 설정한 기준이 없음에도 기계가 스스로 정보를 수집하고 수집한 정보를 분석하여 판단하면 인공지능이다. 예를들어 아픈 사람이 어떤 증상을 보이면 기계가 해당 증상 관련 정보를 수집하여 원인을 판단하는 것이 인공지능이다.

그렇다면 인공지능은 현재 어떤 수준까지 접근했을까? 기계가 스스로 정보를 수집하고 판단하기 위해서는 당신이 상상하는 이상으로 많은 양의 정보가 필요하다. 우리가 흔하게 사용하는 표현인 ‘데이터’가 많이 필요하다는 말이다. 많은 양의 ‘데이터’가 있다고 하더라도 짧은 시간 안에 ‘데이터’를 분석하고 판단해 내려면 ‘양자컴퓨팅’과 같은 고성능 하드웨어의 발전이 필요하다. 무엇보다 진정한 인공지능은 인식(센싱)을 스스로 해내야 한다. 사람으로 비유하자면 오감 등이 이에 해당한다. 그중에서 보기는 ‘비전인식’이라 표현하고 듣기는 ‘음성인식’이라 표현한다. 이 모든 기술이 발전을 거듭하고 있으나 향후 10년간 산업에 적용되는 기술은 사람이 미리 정한 기준대로 알아서 동작하는 인공지능을 벗어나기 어렵다.

인공지능 기술 중 ‘비전인식’과 ‘음성인식’을 거론한 이유가 있다. 현재 가장 빠르게 모든 분야의 산업에 적용될 기술이기 때문이다. 당분간 인공지능은 기계의 입력과 출력 방식의 변화를 주도할 것이다. 기존에는 사람이 손을 움직여 입력을 했다면 향후 5년간 기계가 주변을 보고 소리를 들으며 미리 정해준 동작을 수행하는 시대로 전환될 것이다. 많은 기업과 연구기관들이 인식기술의 발전을 위해 노력하고 있고 더 많은 데이터를 수집하기 위해 기술을 공개하여 사용하게 하기도 한다. 특히 ‘음성인식’ 기술의 경우 언어마다 발전 속도가 다르다.

그렇다면 한국어 ‘음성인식’ 기술의 상황은 어떠한가? 여기서 ‘음성인식’이라함은 단어가 아닌 문장을 인식하는 것을 뜻한다. 단어의 인식은 이미 높은 수준에 도달해 있다. 그러나 문장을 인식하는 수준은 아직 특정 기업과 정부산하 연구기관 일부만 기본 준비가 되어 있는 상황이다. 문제는 모든 기업이 조만간 ‘음성인식’ 기술을 도입해야 한다는 것이다. 대기업은 물론 스타트업도 예외없다. 산업의 분야도 구분없이 거이 모든 분야의 사업에 ‘음성인식’ 기술이 도입되어야 한다.

‘음성인식’ 기술의 고도화를 위해 필요한 조건은 여러가지가 있지만 많은 사람이 사용하는 것이 가장 중요하다. 특히 한국어는 사용자 전체 모수가 많지 않아서 상대적으로 사용자 모수가 많은 영어 등의 언어에 비해서 발전 속도가 느리다는 약점을 가지고 있다. 그래서 한국어 ‘음성인식’ 기술을 통합관리 발전시키는 사회 자산화를 적극 검토해야 한다. 여기서 사회 자산화란 한국어 사용자의 경험을 하나의 ‘음성인식’ 기술로 집결시키는 것을 말한다. 개별 기업과 연구기관이 각각 독립적으로 ‘음성인식’ 기술에 인력과 비용을 투입하는 것은 사회 전체로 보면 고비용 저효율의 손실이 발생한다고 볼 수 있다.

‘음성인식’ 기술의 사회 자산화는 어떤 방법이 있을까? 한국에는 많은 정부산하 연구기관이 있으나 ‘음성인식’ 기술 연구를 주도하는 기관은 ETRI, 한국전자통신연구원이다. ETRI의 ‘음성인식’ 기술은 이미 상용화 서비스까지 경험하고 발전을 거듭하고 있다. 이제 플랫폼 사업화를 통해 기술 발전의 속도를 올려야 한다. 스타트업과 중소형 기업의 경우 플랫폼에 접근하여 사용하고 사용량이 많거나 매출이 일정 수준 이상의 경우에 과금하는 방식으로 운영해야 한다. 사용된 데이터를 무명화* 상태로 ETRI에서 통합관리함으로 상대적으로 모수가 작아 성장 속도가 느린 단점도 해결할 수 있다. ‘음성인식’ 기술을 도입한 다양한 기업 활동은 글로벌 시장 진출 성공 가능성도 높여줄 것이라 기대한다.

  • 무명화 : 개인정보를 영구제거한 데이터로 사용자 개인을 식별할 수 있는 모든 정보를 제거하는 작업을 의미한다.

Connecting Human Values CRONEE, www.cronee.net

Sage Kim (Condiver, CSO) www.condiver.com 
물리학을 전공하고 ICT산업에 뛰어들었다. 신기술 기획 및 전략, 마케팅, 비즈니스 모델 구축 등 20여 년간 현장에서 활동했다.