Data 📊 關於資料科學 … 我想說的是(下)

Sobi
程式猿吃香蕉
Published in
Oct 24, 2022

筆者 Sobi 任職知名外商,摸過各式各樣大資料小數據,喜歡聽故事,也喜歡說故事,《程式猿吃香蕉🍌》客座專欄作家

關於資料科學系列文章,終於來到最終篇了!

  • 上篇分享資料科學實際應用中最重要的第一步就是量化問題。
  • 中篇則是分享心法之一:比較大法,來回答「用戶為何不來」這種開放性的問題。
  • 下篇,則是想跟各位分享的心法之二:轉化,可用來解決看似明確清楚,但是當你順著問題紮紮實實回答,卻又好像沒回答到重點。

是否聽來很詭異?明明老闆問了A,我們就根據A做了詳盡的回答,但老闆卻說這不是他要的???

很難懂吧?老闆的心總是很難懂啊!所以這時候又到了舉例時間!

⊙ 場景:老闆的自由發揮時間

  • 👨‍💼老闆(閒聊狀態):「可以來做個用戶路徑分析嗎?」

🐧🐧🐧••••••••• (現場一片安靜,大家等著老闆下一句)

  • 👨‍💼老闆(一派輕鬆):「就是用戶路徑分析啊!User path analysis ! 不是很多產品都會做的嗎?用來了解用戶走的路徑啊?」
  • 💁資料分析師(禮貌微笑,點頭):「產品都會做的路徑分析,我們當然也要做!」

關起門來,開始問自己:「用戶路徑?那是什麼?不要告訴就是 User path analysis ,別的產品做所以我們也要做?做完用戶路徑要幹嘛?」

沒人回答你,因為發問者可能也不知道!

所以,此時此刻就是心法二上場的時機,用來回答看似明確就不知為何的問題,就是要轉化,聚焦在解答真正有用的問題。瞄準最有價值的地方(老闆擔心的焦慮的,就是有價值的方向),怎麼瞄準?一起往下看吧。

用戶路徑,到底怎麼分析才真的有用?

理論上,用戶路徑分析找到一條康莊大道!

想當年,還是菜鳥的我在電商網站擔任數據分析時,曾經收到老闆的要求,針對電商網站的用戶路徑做細部分析。

什麼是「用戶路徑」呢?是用戶實際操作分佈的狀況。例如有八成的人喜歡從這個網站的首頁進入,另外兩成會直接跳到搜尋商品頁,而這兩成的人裡面又只有三分之一會點選搜尋結果 … 這些分佈的總和就是網站的用戶路徑。

第一次接到這樣的題目,當時的我真的是興奮不已,心想:「我們的網站流量大,流程設計又複雜,如果能夠在迷宮之中找到用戶偏好的路徑,應該是大功一件吧?再加上這個需求很明確,數字都放在那邊了,三兩下就搞定了!」

請先問自己:用戶路徑要解決什麼問題?

果真,年輕人就是年輕人,壓根兒沒想到事情根本不是那麼簡單,關鍵就在於我忘了問:用戶路徑分析到底要解決什麼問題?沒問清楚就一路傻傻做下去。

回頭看當年,真的是好傻好天真的照本宣科啊!

教科書解法

  • 整理資料:從千絲萬縷的用戶記錄中找尋可用資訊
  • 定義用戶行為:瀏覽商品頁,點擊商品,放入購物車,結帳,離開…..
  • 套用機率模型:算出最常出現的路徑
  • 結論:用戶最常走的一條路徑是搜尋關鍵字->點擊結果->連結商品頁->離開

耗費大把時間,運用大量技法

卻只得到了「常識」?

當時服務的公司是台灣規模最大的拍賣網站,可以想像流量多到想吐,不光是整理資料就令人頭昏眼花,再加上網站複雜,用戶路徑的排列組合有上億種可能性,就算在計算過程中想盡辦法收斂收斂再收斂,用了機率模型算出來最多人使用的路徑,也只涵蓋了不到一成的用戶。這份報告花了我好幾個禮拜的時間,用了一堆複雜的技法,才好不容易地從一團亂的巨量資料中理出頭緒。

經過這麼多繁複的步驟,你應該看了都累。但是,在台上才講到第三張投影片,台下的大老闆就毫不掩飾地打了個很大的哈欠。當時的我頭皮發麻,仍佯裝鎮定,帶著就算台下都睡著我也必須華麗謝幕的勇氣,把這份不知道白了多少頭髮的分析報告給講完。

結果呢?

老闆只說:「這個用戶路徑不用你講我也知道,就 … 感覺很不立體。不知道怎麼用這個結論。」

當下,真的是晴天霹靂,沒想到花了這麼多力氣整出來的分析結果,一點都派不上用場 …

正當菜鳥分析師心情掉到谷底,想著是否該放個大假考慮自己去留問題的時候,一個資深分析師同事拉住我,指點了一條明路。他說:「用戶路徑要導向付費/課金才有研究的價值,付費以外的用戶路徑就不用管了,以付費為終點的路徑前一步才是這個題目的價值。」

分析結果沒有指向任何商業應用,不管使用再高深的演算法,就只是一堆數據而已

一語驚醒憨人!!!資料科學在商業最常見的應用不就是…「找到對的目標客戶」「改善產品流程痛點」嗎?我的報告根本沒提到這些重點啊!因為真的只有專注回答了「用戶路徑」,難怪老闆只會打呵欠,對我的報告一點興趣都沒有…

既然掌握了大方向,就讓我們回頭來看看怎麼好好利用分析結果來幫助老闆吧!

善解人意的作法

其實老闆沒問出口的是,是什麼阻礙了用戶掏錢?要怎麼提高成交率呢?

套用比較大法,針對「鎖定目標客戶」跟「改善產品流程痛點」這兩大目標,我們可以列出一些可能的分析方向,例如:

  • 不同目標族群(可能是性別年齡或是消費力高低)間的差異?
  • 不同裝置上成交率有差嗎?手機操作流程比電腦版方便還是相反?

如何比較才是有意義的?找到痛點就對了!

也許你會問,如何知道要怎麼比較,跟誰比?怎麼比?只能說~~這些比較的依據,都是要經過大量的使用者訪談找尋痛點,會根據不同產業跟產品階段有所不同,絕非單靠拼命清理資料套用各種模型就會產生可用的結果喔!

找到痛點,康莊大道就在眼前!

順著這個思考邏輯下來,在用戶路徑分析結果裡發現一個有趣的現象:高消費族群在電腦版網站的結帳成交率遠高於手機 App 版本,經過分析發現,手機版本的結帳流程比電腦版多了兩個步驟,推測因此用戶在手機上的購買慾望就下降了。

有了這個結論之後,工程部門很快地改了一個版本,簡化手機結帳流程,結果真的手機版的成交量就有了明顯的提升呢!

藉此這個例子想說明的是,資料分析可以提供的資訊很多,但是只給出一些直觀的研究報告,不見得對改善產品有用,而是要透過族群/裝置不同維度的交叉分析,轉化問題,聚焦在真正有用的解法,找到了打通路徑的關鍵,這才是老闆要的。

看到這裡,或許有人會說:「資料科學的弦外之音未免也太多了吧?之前提到的量化問題方法論不都白學了嗎?」當然不是!定義量化問題是資料科學的基礎,絕對不容忽視。但是面對大老闆們丟來的變化球,只靠定量分析是不夠的。

讀懂老闆問句背後的心魔,你就學會接住變化球!

大老闆們的問句常常有共同的特性:充滿了「如何」、「怎麼」這些詞語,答案充滿了推測想像,無邊無際。偏偏呢!資料科學只能解決明確的量化問題,回答對還是錯,機率多少這樣的精確問題。

如何彌平兩者中間的鴻溝呢?

經驗告訴我們:學會轉化問題吧!先把開放性問題收斂成明確的量化問題,並透過比較賦予數據意義,給出的答案才會是善解人意版本,老闆也才會對你的高明解讀給予掌聲。

▍資料科學練功集大成囉

資料科學應用之心法
  1. 量化:量化問題絕對是第一步
  2. 比較:透過比較,收斂開放性的問題
  3. 轉化:轉化問題背後的焦慮,聚焦於有用的解法

最後再來總複習,如何應用這三大要訣。

⊙ 場景:回到熟悉的產品會議

面對專案經理提出的問題「怎麼證明這些產品功能可以留住用戶?」

有效的解決方式是:

  1. 把問題轉化成「列舉與證明哪些因素與提高留存率是否有關」。
  2. 透過資料分析提出各種可能假說(例如:「建立自己的喜愛清單, 加入購物車…是否與留存有相關性?」)針對「如何」做出各種選項讓老闆選擇(或者打槍),朝著老闆感興趣的方向前進。
  3. 收斂題目為「留存率與建立自己的喜愛清單」的相關研究。

定義好了題目,終於進入了我們熟悉的量化分析標準流程,跟機器學習工程師討論哪個演算法合適,與資料工程師討論執行細節。

▍結論:基本功必須紮實

大家請記得,信手捻來資料工程,基本統計,檢定,機器學習的經典模型,這些都是資料科學的基礎學習和實作經驗絕對是必備,不可荒廢!更上一層樓:

需要的是「讀懂問題背後的疑惑和焦慮」

簡單說來就是明白大老闆的心魔啦,當大家基本功都不相上下,如果懂得透視問題,直指核心,在一片茫茫資料大海中,脫穎而出就是你啦!

資料科學小教室我們下次見!

若是喜歡我分享的內容,歡迎幫我按個拍手,可拍 50下,給我一點鼓勵,或是加入我的粉絲團《程式猿吃香蕉🍌,一起分享軟體知識與心得!

--

--

Sobi
程式猿吃香蕉

唸過幾年文學院,寫過幾年程式,摸過各式各樣大資料小數據,存在雲端還是在本地端的都處理過。喜歡聽故事,也喜歡說故事,經歷成功的資料科學故事也許不多,但有很多成長的故事可以說:)