|讀書心得|內容算法:把內容變成價值的效率系統

最近接到一個新專案,是要幫一個內容平台建置適合的會員標籤,讓他們得以進行更深入的數據分析(例如找出不同類型會員&內容間的相關性),以及進行內容推薦。

因為先前對於「內容推薦」的瞭解很有限,所以希望可以增加對於這方面的知識。在和在內容平台工作的朋友詢問後,了解到他們公司負責內容推薦的同事,都有看《內容算法》這本書,也因此我也上網找了這本書來看。

看完之後,我對於內容算法背後的邏輯、實務上常用的做法以及在設計內容推薦時需要注意的事有更深入的了解,也想藉著這篇文章整理《內容算法》的重點以及我的心得給大家。

《內容算法》總共分了兩個章節,第二個章節「關於自媒體」,比較是給內容創作者看的,所以我不會花太多時間說明這方面的內容,主要是針對第一個章節「關於內容推薦」與大家做說明。

註:以下心得有蠻多內容是我在閱讀完《內容算法》後,自己的理解與整理,所以會和書裡面的架構不完全一致。

如何提供內容推薦

Step1:收集用戶畫像,了解用戶的行為與喜好
Step2:根據推薦規則,找出適合的內容
Step3:將篩選出的內容進行排序提供給用戶

一、收集用戶畫像,了解用戶的行為與喜好

收集用戶畫像的方法

  1. 方法一:用戶首次註冊登入時,可讓用戶手動選擇自己感興趣的領域,或通過讓用戶對一些有區別的內容進行打分的方式來判斷用戶的喜好
  2. 方法二:透過用戶的「顯式行為」(例如按讚、分享)以及「隱式行為」得知用戶畫像(例如閱讀文章的時長)。通常,顯式行為的權重要高於隱式行為,但是由於顯式行為較為少見,所以需要隱式行為來補充驗證。
A、如果是透過搜索行為而給予的推薦,當搜索行為過去一段時間或是在你顯式購買之後,這類廣告的展現就應該降低或停止
B、如果是根據用戶評分結果給予推薦時,因為不同用戶有不同的打分偏好,例如有人習慣性好評,有人則偏嚴格。因此,需要將用戶的歷史平均分作為基準進行歸一化處理,以衡量用戶評分行為背後的認可度。

收集用戶畫像的應用

  1. 收集用戶畫像除了可增加推薦的成效外,內容推薦的體驗也比較不會因某一內容源不夠而導致無法提供用戶適合的內容。
  2. 為了收集用戶畫像,可以提供用戶不同類型內容,探索用戶喜好,但在用戶留存與探索喜好間,須取得平衡。一般而言,對於新用戶來說,還是以推薦熱門內容為主,吸引用戶留存,等用戶留存OK後,再來探索他們的喜好,推薦一些可能有興趣的內容。
  3. 用戶畫像中,用戶針對冷門內容的互動行為更為珍貴,因為可以更了解這個用戶的獨特性

A-2、根據推薦規則,找出適合的內容

個性化推薦-1:內容標籤推薦

  1. 透過內容標籤,提供用戶類似標籤的內容(例如兩篇都有「大數據」標籤的文章)
  2. 優點:只依賴內容本身的特徵而不依賴用戶的行為,讓新的內容、小眾的內容都能得到展示的機會。
  3. 缺點
  • 建立內容的標籤是個大工程,成本較高
  • 是基於內容屬性推薦沒有考慮用戶對內容的態度,所以可能會推薦用戶很少人在看的內容

個性化推薦-2:根據用戶行為聚類推薦

  1. 根據用戶行為聚類「用戶」:例如用戶B、C都閱讀「教育」和「科技」,從用戶行為的角度看,用戶B、C行為很類似,因此之後用戶C閱讀了「體育」,就可以推薦「體育」給用戶B
  2. 根據用戶行為聚類「內容」:例如「教育」和「科技」都被用戶B、C閱讀,從閱讀行為的角度看,兩篇內容更相似,因此之後有用戶D看了「教育」,就可以向他推薦「科技」內容
  3. 根據用戶行為聚類推薦是目前應用最為廣泛的推薦機制,其基於用戶行為的特點使我們不需要對內容或信息進行完整的標籤化分析和建模,從而實現了領域無關,可以很好地發現用戶的潛在興趣偏好。

個性化推薦實務應用

  1. 除了針對「內容」的相似性進行推薦外,也可以從作者、關鍵字、內容類別、標籤等維度,篩選適合的內容進行推薦。(因為有多維度,所以可以比較用戶對於不同維度的反應,例如某些用戶會對內容來源而非內容類目更加敏感,這就需要放大作者的相似度以降低內容的相似度。)
  2. 當「冷門標籤」或「冷門聚類」被配對到時,須給予較高權重,因為對於判斷用戶獨特喜好的效果更佳(可透過TF–IDF方式給不同的標籤設定權重)
  3. 如果有內容雖然符合規則,但有興趣的用戶點擊效果差,可降低關鍵字內的權重,減少推薦此篇文章(比如某篇關於NBA的內容,如果連偏好NBA的用戶都不怎麼點擊,那麼這篇內容在「NBA」這個實體詞下的權重自然應該降低。)
  4. 須根據內容的時效性,給予不同的推薦策略(短時效例如NBA比賽結果;長時效例如教學文章)
  • 短時效的內容如果過了時效,即便與用戶興趣一致,也不建議推薦給用戶
  • 選擇推薦哪個長時效內容時,可以根據該內容在相同類別中的表現,挑出表現較好的內容進行推薦。(例如AlphaGo比賽影片在圍棋系列影片中較佳,所以如果有人對圍棋有興趣,可以優先推薦AlphaGo比賽影片)

整體推薦(主要是針對新進用戶)

  1. 根據排行榜進行推薦(長期熱門)
  2. 根據時下流行進行推薦(最近熱門)
  3. 根據上述推薦結果,可得到會員對「特定大類別內容有興趣」,接著可以根據數據分析的結果,找出「看A類別的人,也喜歡看B類別」,進而進行下個大類別內容的推薦。

三、將篩選出的內容進行排序提供給用戶

在提供內容給用戶時,可能會遇到同時提供很多類似主題與類型的內容,這時可以根據題材維度、作者維度、關鍵字維度等將內容進行打散,避免用戶連續看到很類似主題的文章(例如都是NBA訊息)

上面是我看完《內容算法》以後整理的心得,因為內容比較多,所以這次改採重點摘要的形式呈現,如果有不懂或是想再深入了解的地方,都歡迎留言跟我說!

如果喜歡這篇文的話,歡迎拍手👏👏或是留言讓我知道。
也歡迎大家到「菜鳥pm(專案/產品經理)的職場心得」的粉絲專頁關注我的最新發文。

--

--

Richard Cheng
菜鳥PM(專案/產品經理)的職場心得

CRM顧問公司數據產品經理&專案經理。先前曾在財經資訊公司擔任APP PM。平時喜歡閱讀以及研究投資理財。 PM工作心得記錄:菜鳥pm(產品經理)的職場心得)https://www.facebook.com/rookiepm/