【問卷設計與量化研究分析】

NTU Data Analytics Club
NTU Data Analytics Club
13 min readAug 4, 2022

從商業競賽、行銷研究到市場調查,大大小小的專案中,我們很常使用問卷來了解目標受眾。然而,問卷設計與分析大有學問,除了敘述統計外,問卷還有什麼進階分析方法呢?一份問卷要怎麼設計,才能得到有用的資訊呢?因此,問卷設計實戰班開課啦!NTUDAC 邀請到第一屆課程長,曾在 IBM 、台灣妮維雅與意藍資訊等企業擔任分析與顧問實習生,並於中國兩岸市場行銷競賽、聯合利華商業競賽等大型比賽中獲獎的 Mike,來為社員們講解問卷設計與分析課程,幫助社員從問卷中找出 insight,進而輔助商業決策。若還不瞭解問卷分析基礎概念與分析方法的讀者,歡迎參考【問卷設計及量化分析】設計有效的問卷,挑選合適的分析方法!初級版文章,內容包含如何建立一份有效的問卷、市場行銷的必備基本概念、問卷分析常用的統計模型。本篇以進階的問卷設計與分析方法為主,若已經對以上內容都熟悉的讀者,可以往下閱讀囉!

本篇文章 key takeaways

  1. 問卷設計與品質監測小撇步
  2. 主成分分析、集群分析、因素分析的實戰操作技巧

一、問卷設計與品質監測小撇步

先前【問卷設計及量化分析】設計有效的問卷,挑選合適的分析方法! 文章中,我們已經簡介了問卷設計方法和市場調查問卷模板、信度與效度定義,本文將列出幾點問卷設計與品質監測的小撇步,幫助大家能設計出更利於市場分析的問卷!

問卷設計 Dos And Don’ts

Mike 分享了問卷在設計時有哪些注意事項,依循這些準則可以讓問卷設計得更加完整細緻。

  1. 避免專業術語,儘量淺顯易懂
  2. 避免太開放性的問題
  3. 問卷設計的前期可以採用質化研究或是焦點訪談,蒐集出受試者關心的地方,製作初稿問卷後,檢驗邏輯、Cronbach’s α 係數 (依照領域的差異可能有不同慣例,但一般會至少 ≧ 0.7)等
  4. 一個問卷題目問一個問題
  5. 題目脈絡清楚,排序由淺入深
  6. 更多資源可參考 SurveyCake 整理齊全的: SurveyCake 問卷題型懶人包,協助你打造最具專業質感的問卷!

問卷品質監測機制

為了衝高問卷回收的樣本數,很多人會舉辦抽獎活動,但當中總會有只想抽獎而隨意填寫或是沒有認真看題目的受試者,若未排除可能會影響分析結果。以下監測機制可以幫助你排除可疑的回收問卷樣本、確保受試者能理解題目、避免受試者漏填問題,為問卷品質把關:

  1. 時間:使用能記錄填答時間的問卷平台,以自己和朋友認真填答的秒數為準,找出填答時間過短或過長的離群值,再評估其填答狀況是否有問題。假設某份問卷受試者認真填答完畢約需要 5 分鐘,那麼收到填答時間為 10 秒或 5 小時的樣本就有可能是受試者隨意填答、未專心作答的樣本。
  2. 群體:若問卷有針對特定群體,例如:有使用過外送平台的消費者才符合受試資格,應該於第一題就詢問受試者,並將不符合資格的受試者篩選掉並結束問卷,避免浪費彼此時間。
  3. 必填:傳統紙本問卷漏填達 ⅔ 的題目,該樣本為無效,然而現在我們有更方便的線上填答表單,例如 Survey Cake、Google 表單、Microsoft Forms 等平台,可以利用必填的設定,來避免缺失值。原則上,每個問題都要設定為必填,除非有特殊情況。
  4. 審閱:發放問卷前,除了自己檢查錯字、題目敘述邏輯外,也要請朋友幫忙填寫並給予調整意見。
  5. 精簡:儘量精簡問卷內容,平均填答時間不宜過長。
  6. 誘因:設計有效、吸睛的抽獎誘因,提高填答率。
  7. 品管:建議可使用以下三種類型的題目(通常與問卷主題無關)幫助監測問卷品質,預防隨意填寫問卷的受試者:
  • 類似題 — 題目舉例:「我喜歡狗狗」,受試者將填答是或否。此題意義與同意題的「我愛狗」接近,可交叉比對受試者填答是否具有一致性,幫助判斷受試者是否有隨意填答的疑慮。
  • 反向題 — 先詢問受試者特定問題,例如:「我愛狗」,受試者將填答是或否。一段時間後,再提問反向題,題目舉例:「我不愛狗」,受試者將填答是或否。此題也可以和同意題和類似題交叉比對一致性。
  • 常識題 — 題目舉例:「一般香蕉的顏色」,受試者將從黃色/粉紅色/紫色等選項中選出答案。若受試者填答並不符合一般常識,也可能有隨意填答的疑慮。此外,除了填答在資料上呈現離群值外,從填答行為中也可以明顯看出受試者是否亂填,例如:量表題都填一樣(33333…)或是交叉填(232323…);填空題填寫亂碼數字或是不符邏輯,例如:最喜歡的樂器填答「美乃滋」。

二、進階問卷分析流程

除了敘述性統計的圖表,其實還有許多分析方法能幫助我們找出隱藏在問卷中的洞察。先前【問卷設計及量化分析】設計有效的問卷,挑選合適的分析方法! 已經簡介了主成分分析、因素分析、集群分析等降維分析方法,此處快速以實際例子幫大家複習一下。

主成分分析是什麼?

主成分分析是一種合併相似變數的降維方法。Mike 以咖啡市場調查問卷為例,假設有三道李克特量表的題目分別如下,用以衡量消費者的品牌忠誠度:

(a) 整體來說,我對於藍咖啡很滿意 (將此問項編碼為:整體滿意 — 藍咖啡)(b) 我願意繼續購買藍咖啡(將此問項編碼為:再次購買 — 藍咖啡)(c) 我願意推薦藍咖啡給自己的親朋好友 (將此問項編碼為:推薦他人 — 藍咖啡)

假設從相關係數矩陣看出此三題間的相關係數皆 > 0.7,若把這三個題目都做為自變數 X,模型將可能失真。因此我們想要產生一個新變數「品牌忠誠度」來作為主成分,試試看它能否代表這三個變數。

如何在 SPSS 中操作主成分分析?

Step1. 於 SPSS 上方選單中點選:Analyze→Dimension Reduction →Factor

Step2. 選擇整體滿意 — 藍咖啡、再次購買 — 藍咖啡、推薦他人 — 藍咖啡為三個變數,並打勾將因素儲存為變數,方法選擇迴歸後按 OK。

Step3. 解讀 SPSS 分析報表,分為以下兩種表格:

(a) Communalities:看 Extraction 欄內的數字,將其相加。如果降維產生的一個新變數,也就是品牌忠誠度,能 100% 代表這三個變數,那麼其相加的值會是 3。假設我們的三個變數:整體滿意 — 藍咖啡、再次購買 — 藍咖啡、推薦他人 — 藍咖啡,對應到的值分別是 0.860、0.882、0.852,將其相加得 2.59,代表品牌忠誠度一個新變數就能代表 2.59 個變數,其中又以再次購買 — 藍咖啡的主成分權重最高,與品牌忠誠度的相關程度最高 。2.59/3 = 0.865,代表其解釋力有 86.5%,這說明品牌忠誠度可以代表這三個變數的 86.5%,具有高度代表性!

也可以使用簡單的數學來理解:品牌忠誠度 (主成分)= 0.860(第一題權重)*整體滿意 — 藍咖啡 (第一題回答)+ 0.882(第二題權重)*再次購買 — 藍咖啡 (第二題回答)+0.852(第三題權重)*推薦他人 — 藍咖啡 (第三題回答)。

(b) Total Variance Explained:觀看 Componant 1 的 Initial Eigenvalues(特徵值)Total 為 2.59,也就是我們剛剛相加三個變數的 Extraction 所得到的數字。% of Variance 為 86.5,也就是我們算出來的解釋力。

Step4. 回去看變數視圖頁籤,檢查看看主成分「品牌忠誠度」新變數有沒有被產生。

因素分析是什麼?

因素分析是找出變數們的背後共同因子的降維方法。因素分析和主成分分析很像,【問卷設計及量化分析】設計有效的問卷,挑選合適的分析方法!簡單說明因素分析主要是「往後找共同因子」,而主成分分析是「向前合併共同變數」,若是還不瞭解的讀者可以點進去文章內觀看喔!

再以咖啡問卷調查為例,假設我們有 14 個消費動機相關的題目,想要知道變數們是否有共同因子,將眾多題項縮減成幾個具有代表性的因素。我們詢問消費者以下 14 個題目,以李克特量表來檢測消費者同意程度。

1.喝包裝咖啡可以提神,讓自己清醒。2.喝包裝咖啡可以紓解壓力,放鬆自己。3.吃早餐時,我會搭配包裝咖啡一起享用。4.吃蛋糕點心時,我會搭配包裝咖啡一起享用。5.跟朋友家人聚會時,我會搭配包裝咖啡一起享用。6.喝著包裝咖啡,會讓我想起過去的美好時光。7.在購買包裝咖啡的時候,我沒什麼特別的感想,每個品牌都差不多。8.包裝咖啡是如何發展出這麼多種口味的,我很有興趣知道。9.飲用包裝咖啡,我很享受那麼濃厚香醇的口感。10.我喜歡看著貨架上陳列各種不同包裝造型的包裝咖啡,並從中挑選。11.包裝咖啡有多種口味,我喜歡逐一嘗試。12.有些包裝咖啡太甜了,口感不是很好。13.有些包莊咖啡太貴了,買不下手。14.包裝咖啡只是一種加了咖啡味的飲料,跟加工產品一樣。

如何在 SPSS 中操作因素分析?

Step1. 於 SPSS 上方選單中點選:Analyze→Dimension Reduction →Factor。

Step2. 選擇 14 個消費動機相關的題目,並按下 OK。

Step3. 解讀 SPSS 因素萃取報表,分為以下三種表格:

(a) Communalities:觀看各題項的 extraction,發現第 12題、13 題的值特別低,分別為 0.471、0.293,代表這兩題和其他題目相比之間的共同性較低,較難萃取出共同的因素,因此將這兩題獨特題項刪除可以提高共同因素的累積解釋變異量百分比。

(b)Total Variance Explained:我們發現這 14 題總共可以萃取出四個因素 (component 的欄位有 4 欄),閱讀 Cumilative% 可以得知累積解釋變異量。原先未刪除任何題項的累積解釋變異量是 62%,也就是說,這 4 個變數(因子)總共可以代表這 14 個變數的 62%。由於上述 extraction 值為 0.471、0.293 的兩題跟其他的關聯性比較低,不適合與其他向度合併為一個因素解釋。因此,我們將前述共同性較低的兩題刪除後,重新跑一次因素分析,發現Cumilative% 從 62.2% 上升到 69.9%。

(c) Rotated Component Matrix:因素負荷量可以理解為:某變數在某個因素裡面的權重有多少,或是某個變數有多接近某個因素。依照 Hair et al. (1992) *(註一)的說法,低於 0.4 的因素負荷量太低,0.6 以上是高,建議可以將 <0.5 的負荷量隱藏,方便視覺解讀。不過值得注意的是,這只是一個準則而已,真正決定一個變數是否應該歸為一個因素取決於理論而非數據,數據只是佐證而已。

*註一:Hair, J. F., Black, B., Babin, B., Anderson, R. E., & Tatham, R. L. (1992). Multivariate Data Analysis (6th ed.). New York: Macmillan.

我們可以從報表知道有四個因子,原先我們需要 14 個變數去解釋消費者的購買動機,現在只要 4 個就可以解讀了!因子1 涵蓋第 4、5、6、3 題,因子2 則涵蓋 11、10、 8、 9 題,因子3 涵蓋第 1、2 題,因子4 涵蓋第 14、7 題。可以將這四個 component 分別歸類,整理出消費者購買咖啡有四大因素,加上一開始刪除的兩個獨特因子,總共六大因子,分別是:搭配分享、嘗試挑選、提神紓壓、加工無感、獨特題項 (剔除掉的兩個選項自成兩個因子)。

集群分析是什麼?

集群分析意在把變數數值相似的樣本分群體,市調中比較常見分成 3~5 群,標準有二:

  1. 各群人數大致相同:各群樣本數不宜過少,若集群後某群少於 5 人,則該群成員很可能是離群值 (outlier),可以考慮剔除後再重新執行集群分析。
  2. 各群於集群變數各具獨特的意義:各群在集群變數上的組平均數要高低不一,才能形成各具意義的群別,有時為了獲得各具意義的群別,在集群變數上要有所取捨。分群後的結果要是可以講出故事的,這非常重要!
  3. 數學方法:可以使用 hclus 目測決定分群數量,或是看 Elbow Curve,觀察每新增一群,群體間變異的下降,但在實際應用上還是以能講出故事為主。

如何在 SPSS 中操作集群分析?

Step1. 於 SPSS 上方選單中點選:Analyze→Classify→K-Means Cluster。

Step2. 將因素分析得到的六個因子放入變數,輸入 Number of Cluster,假設我們想分 3 群就輸入 3,將受試者分成三個群別。Iterate 裡面的 Maximum Iterations 輸入 50,並把 Use running means 打勾。之後按下 Save。

Step3. 解讀 SPSS 集群初步結果,解讀 Number of Cases in each Cluster 表格,去看每群人數是否相差太多。再看 Final Cluster Centers 表格,看每個動機在哪一個分群中的數值較高,試試看能否講出好的故事。假設發現群平均數表顯示第 2 群沒有特別認同的動機而不具特色,此時應該要刪掉一些集群變數或改變群數的設定,重新執行集群分析,直到能講出好的故事為止,才能幫助你產出有商業洞察的分析報告。例如:刪除口感太甜動機、為每個集群命名等,最後我們可以得到三個分群:

  • 第一群「提神舒壓群」:是喝咖啡是提神紓壓,對於加工的東西無感,把咖啡當成是提神工具,不是喝飲料的愉悅感。
  • 第二群「喜愛嚐鮮群」:喜歡嘗試新東西的人,有很多嘗試動機,對於品牌忠誠度低,既然對於品牌忠誠度低,價格敏感度也高。
  • 第三群「喜愛社交」:這群人喝的不是咖啡,而是喝一個感覺,可能是跟朋友聊天分享,價格敏感度低。

以下整理問卷分析流程,幫助你從頭開始做一份有商業洞察的問卷分析報告!

感謝 Mike 帶領社員了解問卷設計的技巧,以及問卷分析方法的實戰 SPSS 操作,搭配 【問卷設計及量化分析】設計有效的問卷,挑選合適的分析方法! 一同使用,便可掌握問卷分析的基礎概念與實戰技巧!

歡迎各位拍手交流,NTUDAC 也會持續在 Medium、Facebook 與 LinkedIn 更新每週社課的資訊,歡迎對資料有興趣的大家持續關注,跟我們交流想法!!!

--

--

NTU Data Analytics Club
NTU Data Analytics Club

臺大資料分析與決策社 (NTUDAC) 為一群對資料科學抱有熱忱的臺大學生創立, 旨在教授學員如何利用數據分析解決商業問題的商業性社團,在 Medium 將分享社團課程與實作專案內容,以期推廣資料分析的相關資訊。