資料白話文運動 — — 從建立 “用戶輪廓” 到 “Persona” 之經驗談

作者:Lany Liu, Senior Data/Applied Statistics Scientist at Mozilla

Mozilla Taiwan
10 min readApr 28, 2020

資料科學家的迷人之處開始於,原來資料領域有這麼多分析方法,直到工作幾年之後發現,這個角色更像翻譯人員,我們不只要能從資料中看出端倪,還要能說出資料背後的故事,讓執行決策的同事們可以採取行動 — — 資料白話文運動,也就是將分析結果轉化成易於理解的語言,讓所有利害關係人(Stakeholder)都能瞭解從資料獲取的洞察(Insight),從而形成商業決策。

坊間對資料科學家的定義雖然稍有差異,但大架構上並不脫幾項能力,包括熟悉分析方法(Methodology)撰寫程式語言(Programming)對產業知識(Domain Knowledge)有所累積以及善用視覺化工具(Visualization);前兩者奠定了資料科學家的硬實力,在面對問題時知道能使用什麼研究方法定義問題,並且進行分析;而後兩者正是協助分析者能順暢地將分析結果落地的軟實力,在面對不同的受眾時,才能彈性調整溝通方式。

過去一年我在 Mozilla 擔任資料科學家,主要負責手機瀏覽器 Firefox Lite 的資料分析工作;這篇文章想與大家分享,如何善用分析方法描繪完整的 Persona ,幫助資料使用者與利害關係人決定產品優化甚至發展策略的下一步;以 Firefox Lite 為例,我們在面對產品經理、產品行銷、業務拓展部門所提出的問題時,要能善用對資料的了解、適合的分析方法,以提供相對應的回答,跨單位共同解決商業問題。

資料使用者的真正需求是什麼?

在一個企業之中,倚賴資料科學家去解決的問題通常包含很多面向,然而很多時候,從資料發現到執行策略間知識的傳遞,往往考驗了資料分析者與策略執行者之間的溝通默契,在過去的經驗中,我對於 “如何將資料的發現讓執行者能吸收並採取行動” 有特別深的感觸,以下舉一個例子與大家說明。

這是一個使用者流失預測(Churn Prediction)主題;透過瞭解使用者流失的原因,協助行銷部門建立使用者關係流程。當時我是這樣對行銷部門分享研究發現的:

如上圖,我挑選了決策樹模型 XGBoost,並透過篩選後的 Feature 為每一位用戶計算流失的危險分數,分數愈高代表用戶愈有可能流失。模型的預測準確度超過九成,確認具備一定的準確度,我們基於這些危險分數,得到一群即將流失的用戶名單。同時,模型也提供了 Feature 重要性,讓我們能一窺哪些 Feature 與用戶流失有關。

如下圖,用戶流失的重要因子,包括此次使用滿意度、上一次使用滿意度,其次則是有關使用者使用產品的指標,例如每個月的花多少時間在產品上、有沒有收藏喜愛的內容、選用哪一種付費方案等等,最終我們將因子依重要性排序如下:

我帶著預測出的流失名單,加上模型告訴我的預測因子與行銷部門討論,我想瞭解業務上可以怎麼運用這份資料;但事實證明,我所提供的資訊遠不夠我的同事讓資料落地,也深刻意識到我們之間存在著需求與認知的落差,行銷提出更多疑問在於 “為什麼使用者會流失呢?” 模型能不能告訴我們更多流失者的行為?知道了原因才能提供正確的溝通對症下藥。透過此次經驗,我了解到資料科學家除了找出目標,也要進一步找到行銷部門可能會需要的操作素材,幫助跨部門順暢的溝通和更好的資料使用流程,才能真的讓資料落實在用戶關係的建立上。

在了解的同事的資料需求之後,我新增了 XGBoost Explainer 分析,呈現出每一位用戶流失的預測過程,用戶能拆解出每一項 Feature 對於流失危險分數的貢獻,也就能找到屬於每個人的流失的因子。

以下方這位小鬍子用戶為例,他被預測為高危險流失用戶的原因在於:使用滿意度低、偏好單次付費的訂閱形式、並且最近的訂閱次數變少了。接著我將與小鬍子行為類似的用戶透過集群分析(Cluster Analysis)挑出來,行銷部門就能與該族群深入溝通,以提高他們的服務體驗滿意度為目標,提升用戶關係。

透過這個案例讓我知道,每當提出一個資料結果(Data Fact),常常會因為無法事先預想資料使用者的使用情境,而給予了無法及時採取行動的建議。我彙整了類似的預期落差的情況,往後在面對類似情況時,務必將故事說得更清楚,才能確實讓資料發現落實在商業流程中。

建立 “用戶輪廓(User Profile)”

我在加入 Mozilla 之後負責 Firefox Lite 資料分析,這是一個上線一年多的產品,並且已經達到穩定的百萬用戶數,大家更多的問題圍繞在使用者行為上 “都是哪些人在使用 FIrefox Lite ?” “我們的產品解決的使用者什麼問題 ?”。

這也是為什麼在分析初期目標上,我決定建立用戶輪廓(User Profile)來了解使用者們在產品中是否能歸納出幾種不一樣的行為。 首先,針對 “行為” 的定義,我為每位使用者計算使用每項功能的比例,像是用來描述這位用戶行為的基因一樣,接著在針對類似行為作群及分析,理想上會產出這樣的結果:

然而實際做完發現,因為產品特性核心功能即是 “搜尋”,導致行為與行為間明顯的差異並沒有被群集分析分離出來(如下圖)。

於是,我試著回頭檢視功能的使用頻率,對頻率資料作轉換來更好的衡量使用程度。轉換的邏輯很直覺,由於瀏覽器有八成以上的使用行為是搜尋,瞭解到搜尋分數達八成並沒有什麼意義,因此,我們依據搜尋行為的使用比例,將用戶在搜尋功能的使用程度做排名,進而定義出用量的底標、均標、高標。做完以上資料轉換,每位用戶的行為間便有了明顯的差異,這時候將轉換後的分數丟進 K-means 做群集分析,便能明顯歸納出幾種不同功能上的偏好與使用狀況。

我將這些資料交給產品經理之後,再次得到了這些問題「是什麼原因讓某群使用者在搜尋情境下需要多種輔助功能?」、「為什麼另一群用戶只用特定又單一的功能?」也讓我更深刻體認到資料分析並不容易回答數字背後所代表的行為的動機,因而展開一段建立 “Persona” 的旅程。

什麼是 Persona?

一般來說,Persona 包含一個角色與該角色的態度、遇到的問題,而這個角色會歷經一段使用行為去解決他所面臨的問題。舉例來說,一名低階手機用戶,在瀏覽器搜尋後會清理紀錄與資料,目的是讓規格低的手機能夠運作流暢。

“Persona” 與使用者輪廓(User Profile)差在哪呢?我喜歡用這個例子來舉例,想像你的使用者一邊跑一邊在吃餅乾,地上的餅乾屑就像是我們蒐集到使用者在手機上留下的使用足跡(Event),我們透過餅乾屑(事件)知道曾經發生在他身上的事情,他曾有過的行為,行為發生的頻率等等,但無從得知他是個什麼樣個性或態度的人、一邊跑向目的在哪裡、為什麼而跑。

一般而言,建立 Persona 會從蒐集質化的訪談資料開始,再經過研究員整理,將所有假設列出來,接著透過調查來驗證這些假設,最後歸納出數個 Persona 。研究方法已經很成熟並且普遍的運動,然而這個方法最常被質疑的地方通常有幾個:「如何確保我們採用的面試者能代表我們的百萬用戶?」、「每種 Persona 佔整體用戶的比例為何?」、「我們要透過什麼管道與這些 Persona 溝通並且執行策略?」

質化、量化方法的融合與互補

這時你會發現,我們已經建立好的用戶輪廓,能明確指出每一位用戶所屬行為類別,要對特定的族群體採取行動是輕易能做到的;然而 Persona 所使用的質化資料,雖然不易操作,但卻可以幫助說出使用者行為背後完整的使用情境和明確的目的。

有了這個發現,我們試著結合量化、質化方法來建立 Persona ,首先,描繪出 Firefox Lite 用戶一共分為九種用戶輪廓,質化研究員基於這九種行為類別招募受訪者,便能在研究初期確保訪談參與者的多元性,解決招募上偏誤的問題。待訪談收集完質化資料後,由質化研究員歸納、整理用戶的回饋,藉此了解每一個用戶使用行為背後的動機。

下一個步驟,是將質化研究發現貢獻回量化模型的關鍵,我們一一檢視每一個用戶回饋,並試圖將質化轉為可量化的指標。舉例來說,有位用戶認為瀏覽器功能應該要很簡潔,希望運用最少資源達到最有效的搜尋結果,他對瀏覽器的功能需求非常少,也不認為瀏覽器應該提供與搜尋無關的服務。針對這樣的陳述,我們試著轉換成幾個量化指標:首先有這樣需求的使用者,搜尋功能使用頻率高、每次搜尋完成的時間短、其他內容服務的使用頻率極低。

透過一連串的整理後,我們就可以再將這些由質化資料獲得的新變數放回用戶淪過的模型裡,最終我們歸納出四種 Persona ,各自擁有不同的使用行為與產品使用目標、動機。

下面這張圖是我們最終整理出一個 Persona 的內容。以這個 Persona 為例,他們信任 Mozilla 品牌,認為由 Mozilla 提供的服務是安全可靠的,因此在瀏覽過程中開啟不明連結時會特別選用 Firefox Lite 開啟,來避免自己遭受病毒攻擊,或是資料被駭。他們通常將 Firefox Lite 做完次要的瀏覽器,使用行為以瀏覽居多,而非搜尋。圖上標注的方框代表不同的資料來源,這份 Persona 涵蓋質化與量化的方法,橘色框的區域即是透過質化研究所得到的洞察,藍色框則是量化方法所得到的結論,其中右下角對這個 Persona 所描繪的行為歸納便是由前面提到的用戶輪廓(User Profile)產生。

基於這次建立的分析流程,我們將 Persona 判斷的過程自動化,每當新的用戶進來,就可透過 K-means 的方法將該用戶歸類到四種 Persona 之中。而這套流程也將幫助提升許多工作效率,例如往後要做研究時,可透過篩選不同 Persona 來達到研究目的,或者是針對不同 Persona 擬定溝通策略等等。也因為建立好標準流程,未來我們便能套用於各個國家的用戶分析,進而歸納出各國用戶的 Persona 面貌。

歡迎加入 Mozilla Facebook 粉絲專頁 Mozilla@LINE 帳號,關注我們的最新動態,隨時與我們保持聯繫!

--

--

Mozilla Taiwan

我們是Mozilla 美商謀智台灣分公司,由非營利組織 Mozilla 基金會所擁有,在台灣為自由開放的網路未來而努力。