[隨手記] — 有資料,要找些 Insight,我們可以從何開始?

此篇是我個人閱讀 I have data. I need insights. Where do I start? 的筆記。有興趣可以參考原文!

幫我挖挖資料,看有什麼有趣的東西?

通常 Mentor 或 Bosses 花了高成本找了 Data 相關的人、建立資料的基礎建設,在這種成本壓力之下通常能看見些產出(ROI)!

這時候就會被這個問題追殺:

mine the data and tell me something interesting ?

這時候就會很困惑,到底該從何開始?

兩個重點需要知道

  • 即便資深的人也未必 100% 知道整個 Business 系統
  • 任何資料描述的是這個複雜系統的某些角度

什麼是 Insight? — 照進黑盒子的光

  • Insight 就是任何可以用來增進你對複雜系統的理解的事件
  • 複雜系統就像是個黑箱子(沒有人 100% 理解),Insight 就像是在黑箱子中開一扇窗

所以,要找尋 Insight 可以理解從複雜系統開始

Predict & Check — 用科學方法找尋 Insight

  • Step1 : 在分析之前,先從現有的認知中建立數個假設
     — 某個重要變數的分布?
     — 變數之間的 Correlation?
     — etc.
  • Step2 : 分析資料,畫畫圖,算算統計量,驗證你的假設
  • Step3 : 看什麼出乎你意料,哪裡讓你覺得很奇怪,不 Make Sense
  • Step4 : (Critical Step) Zoom in,是什麼原因造成奇怪、不合理的事發生
  • Step5 : 找到 Insight,增進你對複雜系統的理解
  • 不斷 Repeat

例子:從資料中探索來自海外需求

  • 例子中預期銷售量會如圖中的常態分布,但實際卻出現雙峰。
  • 右邊雙峰來自於海外的顧客,因為他們一年來一次,一次會買大量的東西回去賣
  • 跟一般的客戶沒有關聯性

得到這個 Insight 後續引發許多相當有趣的問題:

  • 這個海外需求的 Gap,可以去填補
  • 他們都買些什麼產品?
  • 什麼促銷活動適合他們?
  • 海外展店計畫?

有 Domain Export 的協助會更有產出

對你覺得很奇怪事件,也許對他們很正常,所以最好是需要一位 domain export 在 Predict & Check 時幫助釐清