A Recommendation System Not For Your Interests-从一道题目谈起

自己文章的浏览量从最初的400多到现在的不到100,感觉人们更关心八卦和面试的内容,短小有趣的文章是手机阅读者的最爱。那我就讲讲最近网上看到的一个故事吧,和兴趣无关的推荐系统。

人们用手机上传的图片和视频越来越多,手机内容与电脑内容一个不同就是你可以在对内容进行定位。如果我们能对图片增加地理位置的标签,图片内容的标签,那如何根据你所处的位置给你推荐最有趣的图片视频内容呢?

Four Square New York Check-in Data

当我一开始想这个问题的时候,最先想到的是根据你的性别,年龄和从前使用App的习惯来推荐你最感兴趣的内容。如果你是一个年轻男性,那有可能对美女自怕感兴趣;如果你是一个宠物爱好者,那可能会对猫猫狗狗更加在意;附近热门的搞笑视频,通常也会吸引一个人。

这时候,我们可以设计一个根据地理位置和兴趣的推荐系统。这个系统的输入有很多feature,大体上可以分分类。用户方面,根据用户从前对不同内容的反应,可以提取一个interests vector。我们也知道用户的性别,男女,根据profile提取一些feature。内容方面,可以让用户对图片视频标上hashtag,与用户的interests vector相对应。我们还有内容发布者的信息,他们从前对用户的吸引力等等。因为用户生成内容的时效性,我们可以设计freshness feature,根据地理位置设计geo feature。

最后,设定一下你的评价函数,比方说是用户在每个推荐内容上的停留时间和engagement。将这些feature和结果扔进一个GBDT或者Deep Learning System里去,转眼间一个系统就建好了呢。

一段很长的空白

我们搭建了一个recommendation system,这里位置信息到底有什么用呢?重新看看这个地图上的一些点,也许会有很多图像和视频发布在同一个地方,想想看朋友圈里的刷屏信息。When there is a concert in a near park; When Obama come to San Francisco; When NBA finals is happening。

San Francisco Check-in Data

这样一想,我们也许应该对内容进行地理位置和内容上的聚类。对于新的内容,我们可以通过时间来判断;对于当红炸子鸡的活动,我们可以更具类别大小来判断;对于离你的距离,我们可以采用地理位置信息,并且对大城市额外打分。这样才更像是一个推荐附近有趣内容的平台。

最后,来自于我自己的一点小偏见。我觉得能够反复吸引用户的推荐系统,内容符合你的兴趣只是第一步的成功,我们更需要站在不同角度思考,帮助你探索新内容,好奇心才是增长秘诀。In my opinion, recommend content based on your interests is only the first step. The key to the user growth and retention is exploration, fulfill their curiosity.

Like what you read? Give Dong Wang a round of applause.

From a quick cheer to a standing ovation, clap to show how much you enjoyed this story.