인공지능 시세 이야기

트윈하우스
8 min readJun 30, 2022

--

트윈하우스에서 사용하는 빅밸류의 인공지능 시세에 대해 알아보자.

아파트에만 존재하는 시세 정보

국내에 2200만 주택 세대가 있지만 손쉽게 시세를 확인할 수 있는 주택은 대형단지 아파트뿐이다. 이러한 시세를 제공받는 주택은 46% 수준으로 전체 주택의 절반에 못 미치고, 시세 정보는 매도자가 팔고 싶은 가격 정보를 모아서 산술평균한 결과이기 때문에 현실 시세와 괴리가 자주 발생한다.

53%의 주택은 시세가 없었다.

인공지능과 빅데이터 기술로 새로운 시세 정보를 제공

과거에는 시세가 없는 주택은 수 많은 데이터를 확인한 후 부동산 전문가의 주관적 판단을 통해서 시세를 산정해 왔다. 빅밸류는 최신 빅데이터 기술과 공공데이터 결합을 통해 데이터 수집과 정제 시간을 혁신적으로 줄이고, 인공지능 기술과 공간 분석 알고리즘을 통해 전문가의 주관을 모두 객관적인 데이터 학습 기술로 대체하게 되었다.

획기적인 시간단축

대용량 공간정보 처리 기술 빅데이터 시스템

전국토를 대상으로 하는 공간정보란 엄청난 양의 데이터이고, 이를 실시간으로 조회하고 분석하는 기술은 많은 자원을 필요로 하는 작업이다. 빅밸류는 최신 빅데이터 처리기술은 분산 저장 기술을 도입하여 대용량 데이터의 문제를 개선하고, 공간 정보라는 특수성에 맞춘 기술 개발을 통해서 공간 연산에 최적화된 빅데이터 시스템 인프라를 구축하게 되었다.

시세 처리 기술 공개

데이터 확보, 공공데이터의 활용

부동산 관련 정보는 다양한 공공기관에서 개방하고 있고, 월간 단위로 최신 데이터를 손쉽게 제공받을 수 있다. 우리는 다양한 수집 기술을 활용하여 대용량의 전국단위 공간 기반 공공정보를 수집하여 자체 빅데이터 시스템에 수시로 분산 저장하였다.

공공기관 개방정보

수집한 데이터를 정리

다양한 기관에서 제공한 공간 정보를 원천 그대로 저장해서는 다양한 공간 연산이 불가능하다. 따라서 각각의 데이터를 서로 연결하여 데이터간 의미를 해석해야 한다. 그러기 위해서는 공개되는 모든 공간데이터를 하나의 구조로 연결해야 하고, 이 구조는 공간 기술과 국토법, 부동산 법 등 다양한 법률 과 관습을 담아내야 한다.

빅밸류는 모든 공간데이터를 하나의 구조로 담을 수 있도록 연구를 통해 계층 설계를 하였고 이러한 정보 계층을 빅데이터 시스템의 분산 저장 구조에도 반영하여 조회속도를 높였다.

수집 데이터의 단계적 처리

오류와 결측을 찾아내고 정재! 정재! 정재!

데이터 분석의 90% 데이터 정제에 달렸다.

공간정보와 공공정보는 오프라인 행정절차를 통해 생성된 데이터라 오류와 결측이 넘쳐난다. 빅밸류는 7년간 수만명의 사용자와 고객사들을 통해 지속적인 공간 정보 오류 피드백을 받았고, 자체 노하우를 통해 이러한 오류를 끊임없이 검출하고 수정하면서 높은 데이터 정제 능력을 확보했다.

다양한 공공데이터 오류예시

- ‘충청북도’ 토지 정보가 ‘경기도 여주시’ 좌표로 개방된 공공데이터 사례
- 소송 등 다양한 이유로 아파트가 있는데도 장부가 비어 있는 경우
재개발이 완료되었으나 재개발 이전의 장부만 존재하는 경우

주택 시장을 공간적으로 재해석

과거 주택 시장은 단지, 행정동, 시군구 등 정해진 경계 구역을 동질 시장으로 보고 해석한다. 이러한 관점은 대형단지 아파트에는 맞지만 그 외 주택과 중소형 단지 아파트에는 적합하지 않은 해석이다.

또한 최근에는 도시 확장 등으로 행정 경계가 무의미한 시장이 등장하고 있다. 이러한 시장의 변화를 순수하게 데이터를 활용하여 경계를 나누고 접근하기 위한 알고리즘 연구가 추진되었다.

같은 지하철역을 공유하는 시장을 동일하게 보거나, 중소형 주택들도 하나의 단지처럼 분석할 수 있는 기준을 연구하였다.

자체 클러스터링 기준마다 다른 시세 알고리즘 적용

주택은 접근성! 접근성을 알고리즘으로 재계산

지하철 역까지의 거리, 주택 간의 거리, 고속도로 접근성 등

도보로 이동하거나, 차량을 이용하는 경우 등 다양한 이동 방식이 있고, 이러한 이동 거리는 공간 분석에서 가장 많이 쓰이는 기준 정보이다. 직선 거리로 계산하면 간단하지만 이 경우 현실을 반영하기 어렵고, 모든 도로를 반영하는 경우 심각하게 연산 속도가 낮아지는 문제가 존재한다.

이러한 문제를 해결하기 위해 빅밸류는 거리 계산에 헥사곤을 사용했다. 헥사곤은 빠른 연산과 함께 직선 거리에 비해 현실적인 공간 분석을 제공한다.

시계열 분석과 이상치 제거

시세 산정에 가장 중요한 실거래가 정보는 매일 개방되고 있고, 전국적으로 년간 백만 건 이상의 실거래가 지속적으로 발생하고 있다.

실거래는 사람들의 사정에 따라 너무 다르다. 심한 경우 주변 가격의 절반 수준이나 많게는 몇 배 높은 가격에 거래되는 경우도 발생한다. 이렇게 발생한 이상거래를 시세에 모두 사용할 경우 정확한 시세를 반영하기 어렵다.

따라서 실거래가 이상치를 찾아내고 제거하기 위해서 지역과 종류에 따라 시계열 분석을 진행하여 극단적인 고가, 저가 거래 정보를 사전에 필터링 한다.

실거래에서 이상치를 거르는 로직

드디어 시세 알고리즘으로

인공지능 시세 알고리즘은 ‘데이터마이닝 기술’과 ‘인공지능 기술’을 결합한다. 최근에는 공간 빅데이터 기술에 심층 신경망을 결합한 모델까지 계속 발전하고 있다.

시세예측 모델 발전

한집 한집, 인공지능 기술로 유사 사례를 찾아내고 시세를 산정한다.

과거의 시세 산정 기술은 특정 지역의 집 값을 단일 모델로 한번에 찍어내는 방식이었다. 그러나 빅밸류는 각 집의 개별 특성을 최대한 반영하기 위해 한집 씩 시세를 산정한다.

과거에 피해 현저하게 빨라진 대용량 데이터 처리 기술과 다양한 프로세서 병렬 연산 기술로 컴퓨팅 능력의 한계를 넘어섰기 때문에 저렴하고 안정적으로 대량의 주택 시세를 산정할 수 있다.

빅밸류는 한 집의 시세 산정에 0.01초의 시간이 소요되고 병렬 연산을 통해 전국 시세 산정에 하루면 충분하다.

시세 산정 대상 세대를 선택하면 인근의 유사 실거래가 정보를 찾아내고, 이들의 속성과 거래 시점, 접근성 등을 종합적으로 고려하여 시세를 산정한다.

모든 집에 대한 유사거래를 찾아 비교한다.

시세산정 후 정확도 추적

인공지능 시세는 전체 주택에 대한 시세를 매월 정기적으로 산정한다. 정확도는 그 다음달에 실제 거래가 발생한 실거래와 전월의 시세를 비교하는 방식으로 정확도를 추적한다.

시세 정확도를 평가하는 방식은 크게 2가지로 COD와 MdAPE가 대표적이다. 해외 인공지능 시세의 경우에는 MdAPE를 많이 사용한다.

가격평가 후 가격변화가 실거래 추세를 따라가는지 평가
가격 예측후 가격이 정확한지 평가

시세가 실거래가와 유사한 ‘변동성’을 보인는 경우에는 COD가 비슷하고, 실거래가와 유사한 ‘가격대’를 형성하는 경우에는 MdAPE가 높은 정확도를 보여준다.

두 지표 모두 추적하면서 시세와 실거래가의 변화를 모니터링 할 필요가 있다.

미국에서 가장 오래된 주택 시세 전문 기업 Zillow의 경우에는 공공데이터 개방 이후 정확도가 빠르게 좋아져서 현재는 안정적인 서비스를 제공하고 있다.

미국 주택시세 전문기업 Zillow의 MdAPE 추이

금융권에서 인정한 빅밸류 인공지능 시세

빅밸류의 인공지능 오랜 기간 높은 정확도와 안정적인 시세 공급 기술을 기반으로 금융위원회의 혁신금융 사업자로 지정 받있습니다. 은행 담보대출 기준으로 시세 정보를 제공하여 많은 금융기관들이 인공지능 시세 기반의 담보대출 상품을 출시하게 되었습니다.

트윈하우스에서의 주택 시세

트윈하우스는 빅밸류의 시세를 가지고, 트윈하우스에서 담보 대출, 월세, 세금, 경매 등 다양한 기능을 제공합니다. 이러한 시세를 통해 트윈하우스라는 부동산 메타버스에서 투자 시뮬레이션을 공부할 수 있습니다.

부동산 투자 어렵지 않으셨나요? 분명히 오를 것 같은데, 대출이 부담되서 못산 집이 있나요? 레버리지 투자를 이용해서 현실감 넘치는 투자를 경험해보고 싶지 않나요?

트윈하우스에서는 가능합니다.

※ TwinHouse 공식 커뮤니티 —
디스코드 : https://bit.ly/3JtPLxD
오픈카톡방 : https://open.kakao.com/o/g8Xeolke
트위터 : https://bit.ly/38KQG03
페이스북 : https://bit.ly/3PbTowa

트윈하우스는 현재 베타서비스 중 입니다.
https://beta.nft-twin.com/

--

--