【數據分析】Blink社群數據 — 用故事線提出社團增長模型

cover

寫在前頭 — 敘事線簡報的練習

這篇文會紀錄自己在擔任政大創聯會 6.5屆 副行銷長任內所做的一篇結案報告,將資料科學的方法用到社群經營上。因為是結案報告,所以同時附上學期檢討,主要是網站流量相關的內容。這篇文同時也會帶到我畫decks的邏輯,同時用我在創聯會內部報告的成品當作例子。

由於算是這學期才開始做Storyline式的簡報,之前的訓練主要來自於政大管顧社的專案進行與社課內容,還有就是進入管理顧問公司之後學習如何更好地鋪陳整個故事、邏輯貫通,所以不管是社團經營、還是敘事線簡報,自己都還是在學習的過程,屬於學習紀錄性質的一篇文章。

這篇的內容並不一定「MECE」、呈現報告的方式也不一定遵守管顧做decks的守則,更多是針對「營運問題」來提出解方。不到一天的情況下要遍尋可能的問題其實並不容易,相對地,針對既有問題的了解與身為實際的管理者,透過經驗出發的假說可以讓我更快聚焦到找尋root cause與建立假說上,這篇報告更偏向這樣的工作模式。

fb fanspage

workflow

  1. Storyline
  2. Data collection
  3. Data analysis
  4. Reporting

本份報告從0–1 :梳理問題 ->建立故事線->爬蟲收集資料->寫程式->分析 -> 跑模型 ->補充內容總計花了我6小時左右。實際時間不會這麼短,比如在管顧社的時候我們可能就花了2個月左右在順完整份故事線與填滿資料,而工作中可能會花更多時間在確保邏輯的縝密性。

附註:下方的示範因為我截了蠻多不同自己的簡報,所以顏色可能會有不一致的情況、字體也可能會跑掉,重點還是內容。

字少圖多的簡報?

截圖自某一堂課我做的簡報
同一堂課

管顧的簡報通常跟大學生習慣的「字少圖多」非常不一樣,我們會在裡面放上非常多的資訊,作為決策支援與了解事實的載體。所以字通常都很多,方便客戶或者使用者事後查看、閱讀。

前期資訊整理,畫出Storyline

通常我在畫slides之前,都會先多方整理資訊與思考內容,以這份報告來說,這部分大概會花1~2個小時,主要是了解問題、與思考「初步的解決方法」,這時候主要會在數位筆記與紙本上進行,通常都是先初步發想,然後再慢慢收斂到我想要傳達的Key message是什麼,如下圖:

凌亂筆記

然後到時候這些第一層的message都會變成每張slide的Tagline ,並且把每頁slide的標題都總結到第一頁的執行摘要,方便先給予聽眾整份報告的結構與流程會如何進行:

執行摘要

而其實做完初始的整個storyline,就會是我們的假說思考,好比我註記pf : scatter plot ,其實是proof for this content with scatter plot(x ,y ),代表說這一頁我會在下方的內容使用散點圖證明的意思。因為想完message的當下,有非常多的內容都來自於「假說」,很多事情我不確定,我必須思考要用什麼方式、或者什麼資料、什麼事實來「證明」這件事情,換句話說:

假說必須是可證的,不可證則是需要可行動的

在這裡就蠻推薦大家去修數學系相關的課程(不過我是去修蠻多統計系的課XD),數學系有非常多證明的課程與理論,而整本課本的理論知識可能就是循序漸進的,比如說你想證C,而你知道通過A,否定B的當下就說明了C,那寫出這種關係就是一種證明的方式之一。

Ghost deck

也會有我們不知道的事情,比如這邊我可能會用ABCD等代數來先替代,這讓我知道後續我必須做完Clustering才能填上內容,相對也確立了我接下來該做什麼,更能專心在執行面上。

當然在分析之前,必須要確立現在的問題是什麼。這時候我會根據之前與其他人開會、討論得到的反饋來歸納問題面向,並且思考我們該問什麼問題。這也很像在企業端,我們必須有個小組去當各個部門的接口,了解部門的需求與問題是什麼,並且思考解決方案。由於我本身的思考方式比較偏向量化,因此習慣在前幾頁透過關鍵指標來檢視何謂現狀,並且讓問題隨之浮現。

釐清現狀與關鍵指標 — private data
問題浮現

接著就是把既有問題放上來,並且思考能用什麼方式來解決這些「表面問題」,這個時候的問題並不一定是「最終問題」,而只是表面看到的so what ,目的主要在讓大家了解到「那些潛在問題如果沒有被解決,會有哪些現象」,畢竟不是所有人都會對問題survey,我們要先快速recap,當然這也針對報告對象,如果對方已經很了解公司或者社團,那麼這件事情可能就是放在附錄、或者根本不必做。

deep dive

接著我會透過一些數據來說明問題發生的點以及原因:

Fake data 說明用

當然這邊我可能也不只會用管顧的敘事線,因為創聯會主要偏向新創、網路端,所以我也挪用了創投、創業端的簡報技巧,在募資簡報中,經常會有「對比手法」,這邊就可以搭配使用來說明問題:

說明問題用

資料收集

另外因為上面有個問題是內容,所以這邊我們的解決方案是內容改善。我會去思考什麼地方存在這些量化指標,而且是「可取得的」由於社團這學期有在學生社群Blink發文,而Blink的指標都是可見的,因此很適合做為我們的內容評估方向,於是我會在初步的slides上規劃接下來要做哪些資料工作,好比說準備寫一隻爬蟲、有哪些欄位、資料是我需要的。

當然也會有質化分析的部分,這邊我就會用案例說明,在管顧通常會放上best case、good practice來說明這件事情的成效、與更具體傳達執行之後的預期。比如思考過後我認為社團官方網站應從內容定位轉移到連結效果,而非內容輸出的渠道,而原訂的內容渠道可由Blink替代,藉此解決第三個子問題:量化指標不明、寫作功能不完善的問題,所以我也會去尋找好的學習對象當作case,作為solution的說明:

case study

而這份專案中,資料分析的角色在於提供內容參考對象,因此在該頁我必須說明Why Blink、Why this method?

why message

比如說我會用到文字探勘,那麼就需要文字相關資料,因此寫爬蟲的時候這就是我要的資料。然後我會開一個Jupyter(類似Python開發的地方)專門寫爬蟲、清資料,在實際寫之前我會先想好需要哪些函數,執行這個workflow就可以要到我想要的資料,藉此清楚整個爬資料的流程,確保模組化與可重複執行

然後實際寫code :

另外一些分析作法我會放到後面附錄,畢竟這不是這份報告的主體,但是會有人好奇,這時候附錄就很好用了,好比:

Crawling data from web

資料分析

然後設計分析的呈現方法,比如文字雲在文字探勘上是一個很好的手法:

message

接著我可能會用到商業分析的技巧,從宏觀到微觀來剖析,只是對象從市場、產業換到平臺、媒體內容XD

另外也不是什麼內容都放,只是我會在EDA的時候額外得到一些資訊,有些有趣的內容還是得放到附錄,畢竟不是故事主線,很有趣的內容還是不能隨意放,除非我覺得他們之間有不錯的關聯、或者能夠補充更多邏輯:

比如文章觀看分佈,就不會出現在簡報裡
Preference study

這邊的思路就是把我們自己的粉絲資料爬下來,然後去看說還有追蹤哪些人,分析粉絲的重疊性,藉此了解內容訂製與接近Persona。所以分析資料前就是先做一些清洗,並且整理成我們想要的格式:

raw data

轉化一下:

user-user matrix

以及我可能會挑選適合的演算法來做,好比binary就比較適合用K-mode而不是大家熟悉的K-means,並且呈現分群結果,BTW,分群結果真的非常好,有一批甚至抓出「現實關係非常緊密的一群人」,雖然Clustering是一種無監督學習方式,但是搭配對資料的理解,真的常給我驚喜的感覺:

fans clustering

這樣我們就可以接著分析粉絲的輪廓囉!這部分會搭配到質化分析,當然我也會先分析一下有沒有一些特徵,好比觀看數、讀者類型,真的無法自動化或者判別,再透過人工看文章、追蹤作者類型的方式來分析:

並且轉為建議與可行動的操作方式:

solution

然後試算一下成效,作為下次Campaign的KPI參考目標,不過這邊通常都很不好估計、或者估不太準,就是參考用的以及避免做出來沒有什麼改變:

後面就是附錄,可以放上一些技術細節:

還有玩玩資料,比如這種資料是完全可以拿來做推薦系統的,就簡單寫個function來執行推薦演算法就好:

比如推薦這個人也可以去追蹤哪些作者

額外發現:經營風格與粉絲轉化流量

有趣的是,因為我也有一些朋友在經營Blink,所以用推薦系統稍微看了一下,發現某位朋友的粉絲其實「主要來自於某篇心理分析的文章」,而她目前的寫作風格其實比較偏向「行銷教學、實習心得」,這就是數據分析有趣的點了,本來她以為那篇心理的文章只是流量特別高而已,但是透過數據對照出粉絲也追蹤的作者,其實蠻大一部分是心靈、感情層面的作者。

還有Blink有趣的是,觀點放送除了我理解中的職場、大學相關話題,沒想到兵役也是一個熱門觀看點(這邊只列出前幾名,但其實比我想像中多很多),也許可以做個系列campaign來增加流量:

hot articles

看完這篇文章,有興趣了解更多的人歡迎按讚粉專:

  • 政大創聯會(政大創業聯會)來獲取新創與創投相關產業資訊!

以及我們最近有跟XChange合作,點進看更多網路業文章:

歡迎想學習Python資料科學、商業分析、金融知識的人一起交流!本部落格的內容全部都是基於「分享」的實作、理論兼顧文章,希望能夠幫助到所有對資料科學領域有興趣的人們,長期關注可按左手邊的Follow!若喜歡我在 Medium 的內容,可以拍個手(Claps)這邊想做個實驗,好讓我知道你/妳喜不喜歡這篇文章:
拍 10 下:簽個到,表示支持(謝謝鼓勵!)
拍 20 下:想要我多寫「商管相關」
拍 30 下:想要我多寫「資科相關」
拍 50 下:我有你這讀者寫這篇也心滿意足了!

敬請期待下一篇!或是您也可以逛逛我的其他資料科學文章:人工智慧商務系列:

Python資料科學系列:

看我用金融的概念解釋AI:

如果想跟著我實作資料科學,開始寫程式必知必會基礎系列:

--

--

戴士翔 | Dennis Dai
Finformation當資料科學遇上財務金融

外商分析顧問,Ex- Apple Data Scientist,曾在FMCG巨頭/日商管顧/MBB管顧/高成長電商從事商業分析與數位轉型,專注分享管顧、商業、數據分析的思考。分析/演講/合作歡迎來信:dennis.dai.1011@gmail.com