WiDS Taipei 2022 | 講者訪談篇 — 江佩璇 Passion Chiang
講者介紹:
Passion目前於DAZN擔任Experimentation Manager。畢業於政治大學民族學系雙主修統計學系,Passion專注於產品行銷、市場開發與數據分析,並經營自媒體「嗨我是Passion 旅居海外的分析師」,工作區域橫跨台灣、東南亞、英國等地,曾任Agoda數位行銷分析師、AnyMind Group資深市場擴展經理、TenMax產品經理/市場擴展經理。WiDS 2022 Conference很榮幸能以三個問題採訪Passion對於數據驅動解決問題的洞見,本次訪談Passion將會解密:
- 身為資料工作者的價值及迷人之處
- 數據分析最常遇到的挑戰
- 常見的數據迷思以及如何避免訪談影片:https://www.facebook.com/TWiDataScience/videos/3249578021992777
身為資料工作者的價值及迷人之處
Passion 認為在 DAZN 擔任資料分析工作者的迷人之處有:
- 提供有效的解決方案
- 數據驅動跨國商業決策
在DAZN,Experimentation Manager 基本上是一個分析師兼顧問的角色,主要服務各個產品部門,透過設計實驗流程與檢驗實驗結果,提供商業決策建議與優化方向。
整體流程如以下:
定義問題或發現機會點 → 建立假說 → 尋找證據 → 提出相對解決方案
→ 證明是否正確 → 得到經得起被挑戰或質疑的論點
適合喜歡梳理邏輯脈絡、抽絲剝繭的人
第二點是數據驅動跨國商業決策,Passion 以 DAZN 與 Agoda 經驗為例,每個分析師都要看幾十個市場,包含不同語言、時區、文化等,並都是走 B to C 的市場,基本上不可能每個人都擁有那麼多國家當地經驗,因此都是靠數據驅動決策。
數據分析最常遇到的挑戰
Passion 認為在數據分析最常遇到的挑戰有以下兩點:
- 定義商業問題
- 溝通實驗結果
關於商業問題,Passion 覺得最重要的是公司的 North Star Metrics,亦即公司的決策方向,再以此作為決策取捨的標準。
以 Free Trial 為例描述定義商業問題的困難,時間方面像是要提供多久的優惠?溝通方面像是要在哪個時間點傳訊息給用戶?內容方面像是用戶喜歡看哪些內容?這些都是必須在執行Free Trial 之前決定的。
然而執行的結果有可能用戶數增加,但利潤下降,或是在影片下方增加留言區,整體互動率(Engagement Rate)雖然會增加,但 Streaming Time可能會下降,這些取捨都必須根據公司的 North Star Metrics 並跟 Business Team 做討論。
另外的挑戰是溝通實驗結果,數據是最殘酷的,根據實驗結果,或許很快地證明某個團隊或某個專案在做的事情是毫無意義的,並了解不需要這個案子對整體利潤比較好,然而要如何跟公司內部的人溝通或是梳理辦公室政治(Workplace Politics),這是另一種挑戰。
常見的數據迷思以及如何避免
Passion 分享了兩個常見的數據迷思,第一是「相關不等於因果」,第二是「辛普森悖論」。
相關不等於因果
以最廣為人知的冰淇淋銷售數據為例,若分析此數據,可以發現冰淇淋銷售量愈多,同時間小孩在海邊與河邊溺水的數量也愈多,兩個呈現正相關。
然而可以說「冰淇淋害小孩溺水嗎」?
當然不行,有相關性不代表具備因果關係。在實務上,若發現兩組變量具有相關性,此時要做 A/B Test 或實驗,來說明數據的相關性與因果關係是什麼。
辛普森悖論
社群媒體經常有人分享疫苗相關的數據,並指出打疫苗的死亡率比沒打疫苗的還高,然而這個數據可以明確說明不該打疫苗嗎?
Passion 指出若深入挖掘這份數據可能會發現沒打疫苗的都是年輕人,有打的都是老人,所以當我們比較死亡率差異時,並非真正在比較「有打疫苗 vs 沒打疫苗」,而是「年輕人 vs 老人」。
另一方面,數據經常會有時間性,隨著時間遞延,一個人沒打疫苗的狀態可能會轉變為有打疫苗,而有打疫苗的狀態無法轉變為沒打疫苗,因此在分析數據時,需要區隔好時間因素、討論比較基準、了解時間相關性等,如此才能做出較好的決策。