【數據分析】講座筆記-人人都該懂的數據思維課(20190730)

陳炯翰
Han's|Sharing
Published in
5 min readAug 10, 2019
Source:木木卡工作室

參加這場講座對我最大的收穫,就是沒有太多收穫(等等,這不是負評!)

早在今年 4 月就聽過熙哲 (講師) 分享初版的『數據思維』,當時我的數據分析工作還沒 onboard,只覺得他說的觀念很多我根本沒想過,這個思維好像很重要。

剛好工作三個月了,再次聽他分享,整場點頭如搗蒜!講座內容根本就是近期工作收穫的 recap,『資料來源』『資料定義』各種坑都走過,所以才會說沒有太多收穫,實際上講座提到的思維都非常有價值。

「每個人一定都會碰到數據,不只有做特定職務的人才需要」熙哲這樣說,下面我整理了講座筆記,非常推薦每個人看看:

數據分析 10 個重要思維

1.檢查

懷疑你所看到的一切。

可以從這三個角度切入 (1) 現實世界 (2) 欄位特性 (3) 分佈狀況

講師直接舉例「下圖 2 張 (資料庫) 表格數據,你可以找出幾個問題?」

答案是 5 個問題(對,真的這麼多!)
(1) 現實世界:使用者小白註冊日期是 2016 年,但是有 2015 年購買紀錄
(2) 現實世界:使用者精靈購買時間在 2020 年,這是未來時間
(3) 欄位特性:土豆有購買紀錄,但卻沒有註冊紀錄
(4) 欄位特性:HTC 是品牌名,不是商品
(5) 欄位特性:金額為台幣計價,3500.5,不該有非整數

2.來源

一樣基準點才能比較。

講師舉例前陣子『各頻道撥出特定候選人時間比例』的數據圖 (如下圖)。

Source:NCC

他會思考一個問題『這個數據是 NCC 自己調查的,還是統整各家電視台提供的?』這個答案導致數據差異很大,

各家電視台自行調查『判斷各候選人』可能是電腦辨識或人類統計,這兩種方法能有的變數也很多。

3.定義

定義沒有對跟錯,只有是否同步。

講師以常見的『出席率』舉例,不就是『出席人數 / 報名人數』?遲到5分鐘的人也算出席嗎?如果有人來不到一半時間早退也算嗎?

同樣一個指標,每個人定義會有所不同,得到的數據就會有差異,比較兩個數據時要先確定定義是否同步。

4.脈絡

了解使用者流程很重要。

講師舉例『Kobo電子書後台』,以下圖來看使用成效好嗎?(我拍的很爛,總之這張圖右邊第三欄是閱讀率,幾乎都寫未閱讀,實際上他看完很多本)

如果單看閱讀完成率,一定會覺得成效很差,因為有許多使用者會從『行動』按下載來看但不計入,了解使用者脈絡才能更精確的算出成效。

5.拆解

必須先了解業務端的內容。

講師舉例『日活躍用戶數 (DAU) 』,對業務端常見目的就是理解『活躍狀況』,這裡就能去拆解高活躍與低活躍,像是用連續上線天數去區分,而不是單純看總體 DAU。

講師有提供幾個常見的拆解,如『下載時段』、『裝置』、『使用者來源』、『國家』。

6.放大鏡

(這邊不是漏寫,是完全失憶,只記得 Cohort 這個詞 XDD)

7.因果

要確定哪個是因,哪個是果。

有時候我們以為會有B是因為A,但實際上可能完全相反,需要去重新檢視看看。

這邊提到一個很有感的詞是『Magic Moment (關鍵點)』,Facebook 從數據中發現一個新用戶會留下來的關鍵點是『註冊後10天內新增7個好友』。讓我去思考『我的公司產品 Magic Moment』會是什麼?

8.指標

(這邊一樣記憶斷片失憶 XDD)

9.比較

數據是拿來比較的,無法比較的數據沒有意義

有時候『來源』『定義』都同步了,但不同平台給的數據還是有些微差異,那該相信哪一個?

「都可以,就是找一個相信」講師這樣說道,或許沒有一個是最正確的,但針對一個『跟過去的比』『跟競品去比』,看是否有上升或下降就非常有價值。

10.慢即是快

這是做好數據分析的哲學。

講師這段在傳遞『做數據分析,時間急不得』,與其用一個還不完整的數據分析結果,寧願放棄數據採用經驗導向,因為數據做對、做錯都有很大的影響。

在公司裡的數據分析

1. 工作內容:拉資料、做報表、算命、分析(前兩個最重要,做了才知道不同部門看重的很不同)

2. 核心目的:
(1) 不是分析,而是讓越多人用到他們需要且正確的數據
(2) 重降低自己或別人說出「我覺得…」靠感覺的次數

PS. 為什麼說是算命:大家期待數據能得出的 insight 超過範圍(我解讀:對於自己手上數據能做到多少事要有基本認知)

對於這堂課有興趣?

聽說他們每個月都會開一堂,可以追蹤 木木卡工作室
(個人很建議上實體課程,收穫會更多)

--

--