딥러닝 개인화 추천

전무익 (Ed Jeon)

Follow

Published in

당근 테크 블로그

9 min readMay 8, 2019

--

당근마켓 첫화면은 동네 사람들이 사용하는 다양한 물품을 보는 재미가 있어요. 누군가에겐 이제 필요없지만 나에게 유용한 물건들을 발견하게 되고 더불어 저렴하게 득템 할 기회도 종종 있죠. 매일 새로운 글이 올라오는 첫 화면의 스크롤을 내리며 탐색하는 즐거움이 일상이 되어가고 있습니다.

이러한 화면을 저희는 피드(feed)라고 부릅니다. 비슷하게 첫 화면을 탐색하는 피드 관련된 서비스인 페이스북, 인스타그램, 유튜브 등은 이미 개인화된 추천으로 피드 탐색을 더욱 흥미있게 해주고 있습니다.

당근마켓도 사용자 개인의 취향과 관심에 맞는 물건을 발견할 수 있도록 도와주는 개인화 추천 시스템을 도입하면 좋을 것 같았어요! 문제는 저희 팀에 아직 추천 시스템을 만들어 본 사람이 없어서 알아보고 배워야 했었지만, 다행히 의지가 충만했어요🙂

딥러닝 추천 시스템

two-stage

출처: Deep Neural Networks for YouTube Recommendations 논문

유튜브, 핀터레스트의 추천 시스템의 공통된 점은 2단계로 나눠있다는 점입니다. 우선 사용자에게 추천할 후보군을 수백개 뽑는 1단계 후보 모델, 그리고 그 수백개의 후보들이 사용자가 얼마나 관심있을지 점수를 계산하는 2단계 랭킹 모델이 있습니다.

이렇게 2단계로 나눈 이유를 생각해보면 추천할 대상이 많아 사용자가 모든 글에 대한 관심 점수를 계산하기에는 너무 오래 걸리기 때문에 추천할 후보를 대략적으로 빠르게 추린 후 랭킹 점수를 계산하여 다시 정렬하는 것 입니다.

후보 모델

학습 데이터는 유튜브 추천 시스템과 비슷하고 단순하게 초기 모델을 학습 시작했습니다. 단순하게 설명해보면 Input에 대한 Target의 확률을 높이는 방식입니다.

Input : 최근 본 글 ID 50개, 지역, 다음 글을 본 시간
Target : 다음 본 글 ID

후보 모델은 기존 머신러닝 기법이 잘 조화된 모델인 것 같습니다. 계속해서 후보 모델에 포함된 주요 기법을 소개합니다.

Matrix Factorization

학습 원리는 Matrix Factorization(MF)과 비슷했습니다. MF는 사용자x아이템 행렬이 있을 때 사용자 벡터와 아이템 벡터로 분해하고, 다시 사용자 벡터와 아이템 벡터를 dot product 연산을 하여 나온 값으로 점수를 예측할 수 있습니다.

다양한 사용자 정보를 Neural network으로 학습하여 사용자 벡터를 생성하는 부분만 다르고 결과적으로 사용자 벡터와 컨텐츠 벡터를 dot product 연산되는 원리는 같습니다.

Language Model

출처: https://web.stanford.edu/class/archive/cs/cs224n/cs224n.1184/lectures/lecture8.pdf

문장에서 이전 단어들로 다음 단어를 예측하는 Language model를 볼 수 있었습니다. 사용자가 봤던 글 목록을 문장으로 보고, 이전에 봤던 50개의 글을 기반으로 다음 글을 예측하는 방식이 비슷합니다. 그래서 Language model의 학습 기법처럼 negative sampling과 binary cross entropy loss를 사용해서 학습했습니다.

Nearest neighbor index

빠른 실서비스에 고려된 중요한 부분은 유사 벡터 검색을 예측할 때 사용한 부분입니다. 학습할 때는 negative sampling 으로 연산 부담이 적지만, 예측할 때는 한 사용자 벡터와 전체 글을 모두 연산을 해야하는데 글이 많다면 오래 걸릴 수 밖에 없습니다.

dot product 연산은 가까운, 유사성을 찾기 위한 계산으로 볼 수 있는데, 유사 벡터 검색으로 대체할 수 있습니다. 유사 벡터 검색은 학습을 통해 매우 빠르게 찾을 수 있고 이런 부분은 잘 구현된 라이브러리가 있어서 구현 부담을 덜 수 있습니다. 참고로 저희는 faiss 라이브러리를 만족적으로 잘 사용하고 있어요.

Metric

성능 측정하기 위해 Mean Average Precision(MAP)와 Top 50을 사용했습니다. 두가지 수치 모두, 전체 글 중 target 글을 예측한 순위가 얼마나 높은지 나타내기 위함입니다.

아래 그래프는 3일간의 사용자가 글을 본 로그로 학습하고, 그 다음날 하루의 미래 데이터로 테스트를 해본 결과입니다.

2 epochs
전체 target 글 수 : 315,714
MAP : 0.12
top 50 : 12%

수치를 해석해보면 학습한 모델로 50개를 추천했을 때 12% 사용자가 클릭을 했을 거라 예상해 볼 수 있을 것 같습니다. 실제 추천 후 클릭률 측정은 아직 준비 중입니다.

랭킹 모델

후보 모델과 다르게 사용자 정보와 글 정보 등을 모두 concat하여 학습합니다. 그리고 최종 결과값은 dot product가 아닌 Neural network layer에서 나와 더 정확하게 선호도를 예측할 수 있고 값의 정도를 나타내는 regression 모델로 볼 수 있습니다.

전체적인 추천 시스템의 복잡도가 높아 단계적으로 프로젝트를 나누었습니다. 현재 후보 모델까지 구현하여 추천 시스템을 서비스에 적용하였고, 다음 단계로 랭킹 모델은 준비 후 추천 시스템을 더욱 향상 시킬 예정입니다.

예측 결과

사용자 별 이해

한 지역에서 사용자를 뽑아 개인별 추천이 어떻게 다른지 보겠습니다.

옥수동의 두 사용자가 다른 글을 봤을 때 각각 최근 본 글을 기반하여 다르게 추천할 수 있는 걸 볼 수 있습니다.

지역 조건 글 이해

당근마켓은 지역 한정으로 사용자가 위치한 주변 동네의 글만 볼 수 있습니다. 학습 데이터를 지역으로 구분해서 학습하지 않은 이유는 지역간 볼 수 있는 범위가 서로 겹치는 부분 많고, 2개의 지역을 번갈아 볼 수 있어서 전체 지역을 함께 학습했습니다. 대신 학습할 때 지역 정보를 주어 조건부 확률을 학습하도록 했습니다.

위에서 뽑은 사용자가 다른 지역으로 변경했을 때 어떻게 추천하는지 보겠습니다.