Data 📊 關於資料科學 … 我想說的是(中)

Sobi
程式猿吃香蕉
Published in
Sep 23, 2022

筆者 Sobi 任職知名外商,摸過各式各樣大資料小數據,喜歡聽故事,也喜歡說故事,《程式猿吃香蕉🍌》客座專欄作家

第一篇 Data 📊 關於資料科學 … 我想說的是(上),我對資料科學的定義就是解決量化問題的學門,接下來我們就來看看,實務上,資料科學都被賦予如何的期待,解決了什麼樣的實際問題呢?那麼,就透過以下的經典案例(本人親身經歷,業界大蒐奇),來分析一下各種常見的狀況吧!

如果你只想知道答案,這裡提供了教科書解法和善解人意(揣摩上意)的參考解法。不過我更想跟大家分享的是關於資料科學實際應用的心路歷程(也就是拆解題目的要領),提供給想入行,剛入行以及正在路上的熱血青年們參考。

或許,你們會覺得疑惑:「咦?不是說了嗎?資料科學就是解決量化問題的學門?還需要聽你分享心路歷程,有沒有這麼峰迴路轉?都已經被定義成科學問題了耶!!!」當初我也這麼以為,但是理論應用在真實世界總是有一大段路要走,資料科學家的工作可沒那麼簡單!在真正開始解決問題之前,最重要的第一步其實是:

面對提出問題的人,解讀問題背後的焦慮和疑惑,轉化成資料科學可解決的範圍

這句話不大好懂嗎?容我用個簡單的例子來解釋給大家聽:

▍資料科學小故事:老闆的焦慮?

場景:許願池會議

👩‍💼 專案經理:

「產品發布一年多了,新增了很多功能,非常感謝各位工程弟兄們相當給力,我們可以從Google Analytic報表上看到這些功能有不少人愛看愛點,使用狀況都相當不錯,但是但是但是吼...,太多用戶都來逛逛就走了,或是點了又不繼續往下看,留不住啊!用戶留存率可以再更高一些吧?不過因為工程資源有限,想說吼(眼光飄向資料分析師)是不是可以從使用者觀看紀錄的大數據中找到一些線索,跟老闆說明一下,哪些新功能讓使用者在我們的站上逛更久?這樣老闆才願意買單投更多資源嘛!」

👩‍💻資料分析師(正是在下)(清清喉嚨):

「所以是想知道使用過什麼功能的用戶比較願意留下來嗎?」

👩‍💼專案經理(點頭如搗蒜):

「對對對對...單一功能的成效,報表上都有數據追蹤啦,有些功能很好,有些功能看起來有人用,但是好像整體上的感覺講不出個所以然,就是有沒有什麼大數據啊報表啊還是AI啊?可以佐證我們做得很好,像是......什麼分析可以開出一朵花之類的」

🐧🐧🐧•••••••••(現場一片安靜,大家面面相覷……「到底是要證明什麼好?」「整體什麼感覺啦?」「開出什麼花?」)

👩‍💻資料分析師(帥氣自信):

「我想就用用相關性檢定,找出各種功能之間的高度相關因子,再來使用決策樹算出用戶留下的機率….」

👩‍💼專案經理(直接打斷我的話):

「好!就這麼幹!」

經過資料分析師的巧手一番,把專案經理的疑問轉化成量化可解決的問題之後呢,正式進入解題流程!

資料科學標準題型流程

這一輪流程搞定了!準備跟老闆報告啦!

⊙ 場景: 報告當天

👩‍💻 我(內心獨白):「經過嚴謹定義和統計檢定,已經很明確的找出了用戶留存的必勝方程式,只要我正常發揮一向還不錯的口才,就等著驚艷全場,收下老闆的佩服吧!」

(拿出精心整理的簡報,口沫橫飛的報告完畢)

👨‍💼 老闆(點點頭):「感謝分享,你對我們的新功能的分析很清楚,不過這在早在產品設計初期就已經預期會帶來更多用戶了!但我更想知道用戶為何不來耶?因為你剛剛分析的是:會留下來的用戶就只有5%,我們是不是更應該去關心那95%流失的用戶?而且,就數量上而言,95%的用戶數量不是更值得研究嗎?」

95%用戶離開,離開之後就沒有足跡資料,怎麼分析?

各位觀眾,你是否也傻眼了?資料科學只能用存在的歷史紀錄做預測模型,找出關聯。如果用戶沒來,就沒有資料啊!!面對沒有資料的問題,就像沒有土壤,怎麼能開出分析結果的花朵呢?當年的我站在台上傻愣愣的,回答什麼都忘記了,只記得那天的會議室冷氣好冷好冷,我的頭好熱好熱,背部好濕好濕,會議結束之後癱軟在座位上一直想著:不如歸去,轉行算命讀心術好了。「用戶為什麼不來,我怎麼會知道啊….」

這就是經典題型變化球之一:

老闆想知道的不是數據已經有的結論,而是沒有數據的部分,代表的是什麼意義!

當初腦子一片空白被釘在台上,直接被變化球三振的我,經過幾個老闆的磨練,悟出不僅不會被三振,還可以全壘打的道理!

▍數據全壘打的兩大心法

❶ 比較大法:定義問題的指標,也就是把問題變成「我們的狀況跟XX比起來差了多少」

❷ 聚焦在解答真正有用的問題上:在開始分析之前,要先定義我們想達到的目標,例如「找到對的目標客戶」或者「改善產品流程痛點」這些商業上常見應用,而不是各種指標都拿出來亂槍打鳥,太多雜訊反而誤事,去蕪存菁,聚焦於可以解決的問題,其他的什麼都不必說!

兩大心法要如何應用於實戰呢?以下,就拿一個經典變化球題目,來解給大家看吧!

▍經典變化球 — 老闆:「用戶為何不來?」

教科書的解法

用戶沒有來,就不會留下任何紀錄,也沒資料,所以無從得知用戶為何不來,結案。

這是很直觀的反應。沒有資料就沒得玩。

但再多想一下!老闆疑惑的背後好像還可以延伸的題目,再佐以「比較大法」就可以讓這個原本沒入海裡的題目再度浮現輪廓囉!

善解人意的作法

先把老闆的疑問拆成兩個:

1. 明明產品這麼好,用戶為什麼沒有按照想像中報到呢?

2. 如何改善優化他們才會來?

這題學校課本沒有教,乍看之下也想不出怎麼解決。難不成一個一個去問用戶嗎?當然不是!!要解這問題,先讓我們切換到人生的另一個場景:分手。

「啊?資料科學也跟感情生活有關?」我已經看到大家頭上充滿問號了。別著急,請容我慢慢道來。兩個人如膠似漆的時候,花前月下,一切都很美好,「對,我身邊的這位,就是最完美的。」喜歡,不需要理由。

但是到了分手關頭,很常見的場景就是一個人轉身就走,另一個人拼了命想要挽留;「你說,我哪裡不夠好?還是我們的相處不如你的想像?讓我知道,我可以改啊~」

有沒有覺得很熟悉?老闆問的也是「為什麼我們不夠好?還是產品不符合使用者的期待?讓我知道,我可以改啊~」

雖然愛情總是叫人心中充滿疑惑,但資料科學可是來找答案的!你問不到女友為什麼變心,但是資料科學可以幫你找到產品哪裡可以改善!

分析這個問句,其中的好壞判斷,其實需要更明確的定義比較基準:

「不夠好」➡️ 跟什麼比不夠好?

「不如想像」➡️ 原本的想像是什麼?

重點來囉,就是要比較!

「人比人氣死人」,雖然說做人最好不要太愛比較,但是如果要解決問題,比較是進步最快的捷徑。就拿畢業論文來當例子,最後的實驗章節,絕對不能光說自己有多好就夠了,一定會拿很多他人做法跟自己提出的方法比較,以凸顯自己論點的優秀之處。如果真的做得比別人更好,當然就能贏來更多使用者的青睞啦。

好,接下來你會一定會問:那 ... 要跟什麼比呢?跟同業的競品相比嗎?這樣作看來直觀易懂,但是如此一來問題又會多一個:公司之間各種條件天差地遠,很難找到公平的比較方法。再者,要收集到競爭廠商詳細的量化數據幾乎是不可能的,所以連比較的基準都不會有。那,怎麼辦呢?

不如這樣,跟自己當初鎖定的目標比較吧!

而且這些內部數據取得容易許多,只要轉個身拜託資料工程師大大,一定都有!

那,要比什麼呢?

1. 比較:產品設計初期的目標受眾 (Target Audience) v.s. 實際用戶的差異

產品設計的時候會規劃目標受眾的人物誌 (Persona),舉例來說就像是「我做的這個新功能是針對剛畢業的年輕上班族,男性居多,大約是 24 到 30 歲之間。」

這在資料分析的過程中很常用的技巧,拿出當時定義的目標受眾和現在用戶輪廓(年齡性別)相比,檢視兩者之間的差異,以上面的例子來說,如果預期新功能的是年輕男性上班族,結果產品上線之後,數據顯示愛用的其實是貴婦人,那,要怎辦?原本的行銷策略必定要大改,產品的設計跟營運上,也很容易白白讓真正願意花錢的使用者跑掉啊!

話說這狀況我還真的遇過,原本設計給18-30歲族群,結果來的都是小學生,這影響甚鉅,行銷策略上完全不同,營運上來說更是含金量大減啊!

除了比較理想與現實的差距之外,再往繼續往產品本身鑽下去,還可以比較的是產品內部的使用情形。

2. 檢視用戶旅程(User Journey):比較產品每個階段的轉換狀況 Conversion funnel

(圖片來源:https://www.oberlo.com/ecommerce-wiki/conversion-funnel)

產品設計的過程中會定義「用戶旅程」(User Journey),像是地圖導引用戶如何體驗。

使用者在購買產品或是瀏覽網頁的流程中,每個階段都可能放棄,例如網站回應太慢,或者是找不到下一步的按鈕,用起來不順暢,就走人啦。為了解決這樣的問題,資料分析在這個面向能幫忙的,就是透過檢視旅程每一階段的轉換率,得知使用者最喜歡走的路線是什麼?在哪一段流失率最嚴重?使用者在那裡最容易放棄?

透過比較不同路線,就更容易想像使用者離開的原因啦。

以電商網站為例,打開首頁/APP,本來期待用戶把網站當作型錄,一頁一頁翻過瀏覽各種促銷商品,或者是透過個人化推薦組合,讓人看了這個想買那個,所以就花上很多力氣重新設計版面,希望吸引更多人。結果分析結果一看,嗯?大家都用搜尋引擎來找到商品的?是不是首頁型錄不夠好?推薦模組太不誘人?還是使用者已經都是熟門熟路,都能找到自己要的東西,然後精準下單之後走人?

透過有意義的比較,找到優化方向

有了這些比較,便能順利推導下一步棋該怎麼走:到底我們要加強型錄頁的推薦模組?還是乾脆把資源都花在優化搜尋結果上?

原本以為用戶沒有來,就不會留下任何紀錄,也沒資料可玩,所以無從得知用戶為何不來,透過資料分析中的常見技巧:用戶輪廓比較 & 用戶旅程轉換率,就像是原本在茫茫大海中找不到方向,突然發現遠處燈塔的亮光,這下不會迷航啦!。

老闆簡單一句話:為何不來?以為是直球對決,萬萬沒想到是難以接招的變化球。

比較!比較!比較!

透過比較心法,不論怎麼荒蕪荒誕的問題,我們也能在資料土壤上開出一朵花。

你以為這樣就夠了嗎?不!還有一招轉化大法必須分享啊!專門處理看似問題明確,但著實讓人摸不著頭緒的變化球啊!資料科學迷人之處在於解讀問題背後的意義和焦慮。所以下集我們要來分享

『心法二:轉化,聚焦在解答真正有用的問題』

資料科學小教室我們下次見!

若是喜歡我分享的內容,歡迎幫我按個拍手,可拍 50下,給我一點鼓勵,或是加入我的粉絲團《程式猿吃香蕉🍌,一起分享軟體知識與心得!

--

--

Sobi
程式猿吃香蕉

唸過幾年文學院,寫過幾年程式,摸過各式各樣大資料小數據,存在雲端還是在本地端的都處理過。喜歡聽故事,也喜歡說故事,經歷成功的資料科學故事也許不多,但有很多成長的故事可以說:)