【數據分析】講座筆記-人人都該懂的數據思維課(20190730)
參加這場講座對我最大的收穫,就是沒有太多收穫(等等,這不是負評!)
早在今年 4 月就聽過熙哲 (講師) 分享初版的『數據思維』,當時我的數據分析工作還沒 onboard,只覺得他說的觀念很多我根本沒想過,這個思維好像很重要。
剛好工作三個月了,再次聽他分享,整場點頭如搗蒜!講座內容根本就是近期工作收穫的 recap,『資料來源』『資料定義』各種坑都走過,所以才會說沒有太多收穫,實際上講座提到的思維都非常有價值。
「每個人一定都會碰到數據,不只有做特定職務的人才需要」熙哲這樣說,下面我整理了講座筆記,非常推薦每個人看看:
數據分析 10 個重要思維
1.檢查
懷疑你所看到的一切。
可以從這三個角度切入 (1) 現實世界 (2) 欄位特性 (3) 分佈狀況
講師直接舉例「下圖 2 張 (資料庫) 表格數據,你可以找出幾個問題?」
答案是 5 個問題(對,真的這麼多!)
(1) 現實世界:使用者小白註冊日期是 2016 年,但是有 2015 年購買紀錄
(2) 現實世界:使用者精靈購買時間在 2020 年,這是未來時間
(3) 欄位特性:土豆有購買紀錄,但卻沒有註冊紀錄
(4) 欄位特性:HTC 是品牌名,不是商品
(5) 欄位特性:金額為台幣計價,3500.5,不該有非整數
2.來源
一樣基準點才能比較。
講師舉例前陣子『各頻道撥出特定候選人時間比例』的數據圖 (如下圖)。
他會思考一個問題『這個數據是 NCC 自己調查的,還是統整各家電視台提供的?』這個答案導致數據差異很大,
各家電視台自行調查『判斷各候選人』可能是電腦辨識或人類統計,這兩種方法能有的變數也很多。
3.定義
定義沒有對跟錯,只有是否同步。
講師以常見的『出席率』舉例,不就是『出席人數 / 報名人數』?遲到5分鐘的人也算出席嗎?如果有人來不到一半時間早退也算嗎?
同樣一個指標,每個人定義會有所不同,得到的數據就會有差異,比較兩個數據時要先確定定義是否同步。
4.脈絡
了解使用者流程很重要。
講師舉例『Kobo電子書後台』,以下圖來看使用成效好嗎?(我拍的很爛,總之這張圖右邊第三欄是閱讀率,幾乎都寫未閱讀,實際上他看完很多本)
如果單看閱讀完成率,一定會覺得成效很差,因為有許多使用者會從『行動』按下載來看但不計入,了解使用者脈絡才能更精確的算出成效。
5.拆解
必須先了解業務端的內容。
講師舉例『日活躍用戶數 (DAU) 』,對業務端常見目的就是理解『活躍狀況』,這裡就能去拆解高活躍與低活躍,像是用連續上線天數去區分,而不是單純看總體 DAU。
講師有提供幾個常見的拆解,如『下載時段』、『裝置』、『使用者來源』、『國家』。
6.放大鏡
(這邊不是漏寫,是完全失憶,只記得 Cohort 這個詞 XDD)
7.因果
要確定哪個是因,哪個是果。
有時候我們以為會有B是因為A,但實際上可能完全相反,需要去重新檢視看看。
這邊提到一個很有感的詞是『Magic Moment (關鍵點)』,Facebook 從數據中發現一個新用戶會留下來的關鍵點是『註冊後10天內新增7個好友』。讓我去思考『我的公司產品 Magic Moment』會是什麼?
8.指標
(這邊一樣記憶斷片失憶 XDD)
9.比較
數據是拿來比較的,無法比較的數據沒有意義
有時候『來源』『定義』都同步了,但不同平台給的數據還是有些微差異,那該相信哪一個?
「都可以,就是找一個相信」講師這樣說道,或許沒有一個是最正確的,但針對一個『跟過去的比』『跟競品去比』,看是否有上升或下降就非常有價值。
10.慢即是快
這是做好數據分析的哲學。
講師這段在傳遞『做數據分析,時間急不得』,與其用一個還不完整的數據分析結果,寧願放棄數據採用經驗導向,因為數據做對、做錯都有很大的影響。
在公司裡的數據分析
1. 工作內容:拉資料、做報表、算命、分析(前兩個最重要,做了才知道不同部門看重的很不同)
2. 核心目的:
(1) 不是分析,而是讓越多人用到他們需要且正確的數據
(2) 重降低自己或別人說出「我覺得…」靠感覺的次數
PS. 為什麼說是算命:大家期待數據能得出的 insight 超過範圍(我解讀:對於自己手上數據能做到多少事要有基本認知)
對於這堂課有興趣?
聽說他們每個月都會開一堂,可以追蹤 木木卡工作室
(個人很建議上實體課程,收穫會更多)