問卷分析怎麼做?以數位金融產品調查為例

導論:問卷還停留在初步描述資料嗎?

在大多數商學院的課程中,學生多會修「行銷管理」、「市場調查」等等了解消費者行為的課程,許多商業競賽也會透過問卷來得到量化分析的結果,因為常常看到學生在做問卷調查,但是不管是學生、業界,多數人僅停留在「這個數字多少」、「這個向上、那個向下」,往往沒有一個「好的故事」來把整體分析做包裝與轉化成好懂的訊息,所以就想在這邊簡單分享一下自己做問卷分析的方法,一樣,數據分析沒有一個「固定的模板」,在這邊只是以朋友之前發的數位金融問卷為例,主要想分享的方法為下列三點:

  1. 分析前,根據資料或者目標思考想傳達的訊息製作故事線
  2. 分析要可比,將資料分出群組對比差異來尋找洞見(這個案例我分為使用數位金融者與非使用數位金融者)
  3. 目的與意義永遠先於工具,挑選自己資料分析順手的工具即可

事前準備 — 資料前處理

通常如果用Google表單或者Survey Cake 的問卷來做都是不太適合直接用Python讀入的,理由是狀況題題幹敘述長、連結性問題中間邏輯不連貫等問題,所以一開始我會先用Excel 把前後邏輯是在調查同一件事情的變數拉到一塊,再把題幹敘述改成英文、簡短的名字方便在寫程式的時候呼叫。比如:邏輯題經常會出現否認敘述為空值的情形(因為填答者不會看到這條問題)、問題如「請問您使用以下數位銀行功能的頻率(1為從來沒用過、5為非常頻繁使用) [記帳理財]」(不適合作為變數呼叫)

原始問卷

所以我就變了一個魔術把它變成這樣:

邏輯題處理會比較麻煩、這邊有兩次所以寫了兩段
順便把表單變數重新命名

耗費時間:10 min

然後就可以用這份初步整理好的資料來做囉!這道流程是把資料變成Python好讀的步驟,也可以在整理的過程中了解一下各個欄位分別代表什麼意思、有哪些變數。

分析前,先思考故事線

了解邏輯編排與自己分析的目的

通常我在分析前、甚至做問卷前會先想好我要問什麼問題、預期得到什麼答案,我能夠產生什麼行動等等… 因為這份問卷並不是我做的,是跟朋友要來玩的XD 所以看到欄位的時候就變成想:「這些資料可以回答我什麼問題?」並且把它變成一個「故事」,然後再不確定的地方先用代號標注即可,類似:

填空

耗時:60 min ,這裡通常會花非常久的時間、因為要想像、思考自己想要得到的結果是什麼、有沒有跟專案目標一致、能不能透過這些發現產生價值,然後來回刪改、甚至討論。

比如在開頭我會先告訴大家:「我這裡主要針對哪幾種人來比較差異」,並且想好有什麼訊息是可以從資料裡面得到的,這時候大概就是一邊看資料,一邊在腦中想像這些資料可以組合出什麼訊息、有什麼圖表是可以預期得到的,所以在我還沒開始分析前,我已經可以做9頁的簡報,每頁簡報「標題」就是分別放上面這9條訊息,而「內容」則是根據我的資料分析結果來填。因此你就可以在分析的時候思考這些內容能否充分說服、夠不夠支撐上方的標題論述。而第二層的bullet point 可以是自己會怎麼去證明上面這條論述的初步想法。

在這份分析中,我主要想探討兩種人,一種是「已經有數位金融帳戶」的人,以下簡稱User ,另外一種是「尚未有數位金融帳戶」的人,簡稱comer (即將使用、潛在使用者),所以對於銀行端來說,這樣的切分其實可以回答很多問題,比如最簡單的:

  • 如何吸引 comer 使用數位金融?
  • 如何增加 user 活躍度?

了解分析單位之後,我們接下來就開始一步步去填內容:

問卷分析 — 填補所有空白與思考內容

總耗時:6 hr

簡單看一下問卷發放情況,4/2發出問卷與交流版宣傳,因此那一天填答數非常高。如果沒特別分享的話填答數其實都不到10,隨後大概三個峰值應該是分頭分享的結果,相同的套路之後也可以適用,這樣約一週可以預期收到500份問卷。

首先來填我們第一張簡報:

____ %的使用者手機使用時間長,但是去實體銀行的頻率非常低

這其實是我想要在開頭先講填問卷的人大概長什麼樣、也想告訴聽眾「金融數位化趨勢明顯,應重點關注我待會要講的內容,因為我就是來跟你講數位金融要怎樣可以更好….」

所以會先放第一個,這時候諸如「手機使用時間」、「年齡」、「性別」等個人屬性資料就非常有意義了,因為你可以自由組合不同的變數來查看自己收回來的問卷大概都是誰在填,有沒有跟自己的「目標受眾」是相似輪廓。我習慣使用熱點圖來視覺化類別變數 x 類別變數的資料,比如在這邊我把「手機使用時間」與「一個月上實體銀行的頻率」做交叉,就可以看到很明顯的「填答者都不太去實體銀行,但是花了非常多時間在手機上」這就有一個很明顯的訊息暗示:「填答者大多留在線上且甚少線下去銀行,數位化潛力巨大」。

手機使用時間長為數位金融發展基礎,金融生活從線下轉移到線上

  • 我們可以看到多數人在一個月內到實體銀行不到一次,但是使用手機時間非常長,特別是一天使用5~7小時的手機使用者,可見其潛力巨大,使用者在手機耗費的時間可轉化為使用數位金融服務的基礎

甚至可以搭配外部資料來輔助問卷的結果,好比說我在做的是金融領域相關問卷,就可以去銀行局、金管會逛逛有什麼資料可以拿來搭配:

source : 銀行局資料
  • 實體銀行拜訪次數少,銀行近幾年也縮短實體分行數,可以看到近年來的實體分機構數目下降,金融服務渠道轉型

而如果在報告上我想要更強烈一點,我可以把「近幾年」的概念加強,然後將機構數目從2014而非2006開始畫出來,就會看到一個更明顯的下降趨勢。

好,第一張簡報的內容大概有個底,接下來我們來看第二個:

消費者最常使用_____ 與 ____功能,我們可以透過 ____與 ____來吸引新的消費者

我們會想知道「使用現況」,也就是問卷填答者的金融服務使用情況。

金融服務頻次

可以發現記帳還是佔了大多數人使用的金融服務最大一塊.網路銀行則是因為多數人若有實體行,也會透過網路銀行掌握自身帳戶狀況。意外的是使用理財app非常的少。

此時也可以對比我們剛剛說的User 、Comer ,看一下他們之間的差異,因為終極目標可能是「如何把Comer 變成User ? 」所以觀察兩者的差異就非常重要,我習慣使用柱狀圖與群組圖來對比類別資料的差異:

comer 與user 比例

比較一下可以發現comer(沒有使用數位金融人數) 還是佔據大多數,使用與非使用兩者的比例大概是1:2:

群組圖可以很好呈現兩者差異

而功能使用率方面記帳與理財顯然普及率不錯,但是其他金融相關服務上明顯使用率低於數位金融使用者,可見以學生族群的comer來說其實對「投資」、「網路銀行」等的意識並不高。

知識補充:多選題怎麼辦?

補充朋友問到多選題的字串常常會混在一起,比如說App 使用習慣:

這種如果直接畫柱狀圖或者分析,會因為選項太多而不好分析,此時我的做法是把它做編碼,將「單一多選題」選項變成「有沒有選這個選項」的方式,好比說一個人選了記帳、存款,那我就新增記帳欄位 = 1、存款欄位 = 1,但如果一個人只有選記帳,我就存成記帳欄位 = 1、存款欄位 = 0 ,程式碼如下:

將多選題的選項變多

如此一來本來是多選題的資料,就可以拆成類似如下0、1的多個欄位(欄位數 = 多選題選項數)

1表示有選、0表示沒選

這樣一來就可以統計不同欄位的1的數目來了解哪個功能最多人用、或者使用者只要使用投資功能,也會使用記帳功能等分析…

問卷小誤區:重複、誤導性的問題不用放

咦,comer 怎麼會一下說有,一下說沒有數位銀行?

另外我們也發現照理說comer是沒有數位銀行app的,這些資料可能是:

  1. 亂填答來的
  2. 他們不太曉得數位銀行與網路銀行的差別,所以指的很有可能是網路銀行

我覺得2是比較有可能的,因為在讀入資料的時候,有個地方也讓我覺得很有趣:

注意看freq_變數的數量

這邊是使用數位金融服務的資料,有190人是普遍填答使用這些功能的,但是「行動支付」這一塊我猜是因為有很多人雖然沒有數位金融App,但是有裝其他的行動支付App, 所以在這方面填答人數變多(282人),但這不是我們調查數位金融所希望的,混雜到其他有相同功能、但是不同的App。結合上面.這裡可以看到兩個問卷設計的誤區:

  1. 行動支付其實可以放在「使用哪些金融服務」的模組而非「數位金融調查」
  2. 調查「是否使用數位金融服務」時其實已經回答了「有沒有裝數位銀行App」,故數位銀行App的選項其實是沒必要放入該問題中的,反而會誤導使用者

有兩種「未使用者」,一種是 ____ ____

資料沒有就會出現NaN

聚合觀察26~30以上其實可以縮減為一類,資料筆數太少,是跟發放渠道有關。所以我們把資料處理為25以上再跑一次:

我們重點關注的還是在手機使用時間3~7小時,18~21歲的使用者。那麼這些人有什麼特徵呢?可以看到60%的使用者都是3~7小時的用戶,就變成重點關注的對象。

我們也好奇:哪一家銀行在實體行最多人使用?

comer 最多人使用的還是以中華郵政為主,商業銀行在中信、第一、國泰等都還不錯,也許是之前line pay 跟中信的合作成效良好,從上面的行動支付普及率來看我們也可以發覺說常用功能是一個很不錯的行銷管道,所以回到最高使用次數的「記帳」,可以思考有哪些App 已經具有一定知名度(比如說記帳城市?),透過聯合手段來增加開戶數,並且透過開戶來導引到公司的數位金融產品上。

消費者最常使用_____ 與 ____功能,我們可以透過 ____與 ____來吸引新的消費者

使用功能統計

那麼他們到實體銀行的目的是什麼呢?通常是開戶、存款、辦理信用卡等業務… 也因此線上開戶、線上辦卡等就是便捷的關鍵點,進一步就是分析銀行在線上開戶、辦卡的使用體驗來打消費者,好比說「三步開卡」、「不需臨櫃」… 且有詳細說明的步驟、影片等等… 透過降低線上開卡難度來提升體驗,所以其他里里匝匝的業務優先順序其實沒那麼高,真正讓這些有銀行帳戶、但沒有數位金融使用經驗的人有感的就是「便捷性這點」,因為這可以與他們過去到實體銀行辦理業務做對比。

但是用什麼方式行銷呢?因為我們想要回答: 我們可以透過 ____與 ____來吸引新的消費者:

恩?最高值居然是銀行

大多數人接受的管道是「銀行」但是銀行其實算是其他選項的集合,比如說開戶時銀行專員介紹、實體銀行、銀行網站發現… 大多數人對於選項類別都是銀行,這邊就很難有什麼確實的發現,可以在之後改成設計不同選項的選擇題,用文字填答的方式就是會造成相似詞其實是相同表達,比如說「沒有聽過」 = 「沒聽過」,但是在回收資料上就是兩筆不同的資料。

不過沒關係,因為問卷還有調查「最常接觸的管道」與「接觸金融的管道」,所以這邊可以分成「資訊被動接收者」與「主動尋找者」並且觀察他們接收資訊的情況。在被動資訊部分,新聞媒體還是最常見的管道:

BBC、電視廣告等為最多人使用的管道

主動尋找者的方面,搜尋引擎還是最常用的:

主動搜索的渠道

所以想要吸引兩種人,可以透過:

  • SEO : 搜尋引擎優化來提供資訊,搶佔有興趣者的市場 -> 主動者
  • 公關稿與標題著重常用數位金融功能,比如記帳來吸引眼球 ->被動者

又SEO、主動發布新聞稿可能會花費額外成本,所以可以看還有什麼方式可以使用增加觸及:

主動接觸
被動接觸

可以發現,對於主動搜尋者而言,真正push 成為使用者的管道其實是PTT、Dcard,而Line 與 Messenger應該是加入數位銀行帳號之後才使用的,因此相較比較不花費成本的PTT與Dcard等社群媒體也可以考慮佈局。

而如果是被動接觸,可以發現使用數位金融的使用者看商周、財金相關網站的比例本身就偏高,而電視廣告與社群媒體、Blog 是比較好的管道,但是廣告與網路新聞可能會花費額外成本,總結以上兩點,我們的下一步成本較低、但是可以增加觸及的行動為:

  1. 思考在PTT、Dcard上的溝通策略,藉此獲取主動搜尋者,同時計劃投資SEO
  2. 思考在粉專經營如何增加觸及、跟社群媒體粉專合作、開設相關Blog等…

大多數的「未使用者」對於___ 與 ___ 最感興趣

問卷也對於方案選擇做了調查,這在前期對於市場調查可以了解到方案設計或者產品的概念 雖然這邊用5分的李克特,不過這種問題其實也可以用Ranking score,我們來看看題目:

請試想像自己是小瑄,並憑直覺選出以下方案吸引您的程度(1為最不吸引、5為最吸引)🙏🏻這題有點長,但還是麻煩你仔細作答,辛苦了🙏🏻

  1. [國內一般消費 1.2%現金回饋]
  2. [指定影音娛樂/運動健身通路 刷卡享 7%現金回饋]
  3. [指定影城二人同行購票享75 折]
  4. [跨行轉帳 / 跨行提款每月各 50 次免手續費]

我們來看看comer 對什麼功能最有興趣,從這張圖可以看到很有趣的幾個點:

比較兩者的差異
  1. feature_1(現金回饋) 顯然最受歡迎,不論兩種群體,現金回饋果然還是最有感的,當然對企業來說,如果這點做了確認,我們可以再來分析「對回饋金額的敏感度」,因為n%就是一筆額外支出,這邊就得精打細算才行。
  2. 在2、3的comer 分數都是高於user ,4則相反,這意味實際使用之後,其實跨行轉帳、跨行提款免手續費的價值對於使用者來說是很加分的,但是對於沒使用過的人來說就沒那麼有感,他們反而對於「消費類」的2、3(選項都是指定通路回饋)特別感興趣,這也帶出了對於經營上與吸引新使用者的不同策略

思考策略面:怎麼樣用數據分析的結果驅動商務?

  • Revenue increase — 對於新使用者的吸引:應該使用消費性通路回饋來增加使用數位金融服務的誘因,此時進一步的「通路調查」就很重要,這群人喜歡去哪裡?可支配所得的花費方向為何?
  • Cost Saving — 對於既有使用者的經營:了解使用者對回饋的敏感度,提供多少%的現金回饋不會造成客戶流失又能保持活躍使用數?提供多少次的免手續費可以保持客戶留存?

而如果身為公司,此時就可以拿出內部資料來做進一步的分析。

品牌 ____、 ____是使用者經常使用的主因,因為這些原因 ____ ____

品牌上,Richart 在年輕人中知名度是相當高的,而國泰KOKO也不落於後,後幾名則沒有太大的差異。因此可對Richart 與國泰等做更進一步的案例研究,了解他們拓展知名度的方式。

bank brand

兩者的可支配所得差不多:

可支配所得分配
常用功能探討

而最常使用的功能中轉帳是最常用的,其實這樣的場景非常合理,學生間經常出現吃飯分帳、代購、代墊的交易行為,比如訂外送往往一個人訂、到餐廳一個人先結,其他人再把錢給他等等… 轉帳的便捷性也是最自然而然傳播的(因為行為常出現,當一個人使用之後身邊的人也會跟著一起用),因此在吸引新使用者上我們可以透過「首次轉帳成功回饋」、「n次轉帳優惠」等策略來讓既有使用者把新的用戶拉過來,感覺會是一個蠻不錯的行銷方式。

而就持有的帳戶而言,其實永豐大戶佔據第三名,這點可以對照到上方的品牌知名度結果,由此可推論台新、國泰的使用族群以學生來說其實使用較多(所以知名度較高)但是永豐主要客群可能不在學生,造成說辦理的人第三多,但是在學生中知名度沒那麼高。

那這些功能訴求有所差異嗎?我們試試看把品牌與使用功能的結果做PCA(主成份分析)

熱點圖呈現功能定位

其實就這張圖很難看出差別(biplot的資料點分散不代表這個結果是可以信服的),比如國泰、王道在這邊就找不出特色,主要原因是問卷設計上這邊統一調查了使用頻數而不是針對不同品牌的使用評分,也因此這邊PCA就做不太出什麼結果。這是稍微可惜的一點,畢竟如果是公司會想要了解自己在市場上的定位、跟別人有什麼不同,並且向使用者最常使用的功能(轉帳等)做優化靠攏就能創造優勢,這裏無法回答這樣的問題。

定位不明確,資料過少,可試試看增加資料與變數再跑一次

總結

那麼以上,就是這次的問卷分析實作,這是一種比較微觀的角度來看數位金融產品的趨勢,不過由於這邊站在客觀立場,所以如果是協助選定品牌、輔助內部資料就能夠做更細緻的定位與分析,比如幫台新擬定出Richart 的下一步操作方式、幫KOKO梳理出UX 優化重點….

所以如果您有其他問卷調研與分析的工作要做,可以試著使用這套方法試試看,有其他問題歡迎透過e-mail聯繫我做進一步的討論,感謝您的閱讀!

歡迎想學習Python資料科學、商業分析、金融知識的人一起交流!本部落格的內容全部都是基於「分享」的實作、理論兼顧文章,希望能夠幫助到所有對資料科學領域有興趣的人們,長期關注可按左手邊的Follow!若喜歡我在 Medium 的內容,可以拍個手(Claps)這邊想做個實驗,好讓我知道你/妳喜不喜歡這篇文章:
拍 10 下:簽個到,表示支持(謝謝鼓勵!)
拍 20 下:想要我多寫「商管相關」
拍 30 下:想要我多寫「資科相關」
拍 50 下:我有你這讀者寫這篇也心滿意足了!

敬請期待下一篇!或是您也可以逛逛我的其他資料科學文章:人工智慧商務系列:

Python資料科學系列:

看我用金融的概念解釋AI:

如果想跟著我實作資料科學,開始寫程式必知必會基礎系列:

--

--

戴士翔 | Dennis Dai
Finformation當資料科學遇上財務金融

外商分析顧問,Ex- Apple Data Scientist,曾在FMCG巨頭/日商管顧/MBB管顧/高成長電商從事商業分析與數位轉型,專注分享管顧、商業、數據分析的思考。分析/演講/合作歡迎來信:dennis.dai.1011@gmail.com