【問卷設計及量化分析】設計有效的問卷,挑選合適的分析方法!

NTU Data Analytics Club
NTU Data Analytics Club
13 min readJul 8, 2021

本次的社課很榮幸邀請到 DAC 第一屆課程長,曾在 IBM 、台灣妮維雅與意藍資訊等企業擔任分析與顧問實習生,並於中國兩岸市場行銷競賽、聯合利華商業競賽等大型比賽中獲獎的 Mike,與我們分享如何設計一份具有分析與參考價值的問卷,以及量化模型的理論與應用。

問卷設計及量化分析

本篇文章 key takeaway:

  1. 如何建立一份有效的問卷
  2. 市場行銷的必備基本概念
  3. 問卷分析常用的統計模型

問卷設計方法和市場調查問卷模板

問卷設計準則

  1. 確定設計問卷的情境
    需要問卷的情境有很多種,舉凡學校課程、商業競賽、實習專案,甚至不同種類的論文,都有其適用的問卷情境,像是輕鬆娛樂性質、研究性質或監控性質等。
  2. 明確問卷的目標
    在設計問卷之前,應該要先確立此次問卷的目標,也就是要驗證那些假說,如:男生愛狗、女生愛貓等,先畫靶再射箭。
  3. 從問卷找出規律和洞察
    像是利用回歸分析,找出零用錢與購買手搖杯的關係;或利用集群分析,將年輕人使用手機的行為進行區別和歸類。
  4. 問卷問題的設計
    簡單來說就是要避免過多的專有名詞,整體脈絡清晰,且一個題目只問一個問題或是只有單一個目的等,文章後續將做更多的說明。

問卷設計常用題目類型

  1. 是非題
    只有「是」與「否」兩種答案。
  2. 二分題
    只有兩個答案選項,但答案內容不單為是否,如:請問你來自?台灣/海外。
  3. 單選題
    又稱選擇題,至少有三個以上的答案選項,但填答者僅能從中勾選一個選項,且設計時要遵循互斥性 (Mutually Exclusive) 和周延性 (無遺漏 ; Extensive) 的特性。像是最喜歡吃什麼肉? 若選項為,豬肉/海陸雙拼/狗狗肉,就不符合互斥性與周延性。
  4. 複選題
    每個答案選項都相當於是一道是非題,如:請問您平常的通勤方式? 步行/公車/捷運/自駕…等。
    而上題的每個選項就如同使用是非題詢問填答者,請問您平常步行通勤嗎? 請問您平常自駕通勤嗎? ...等。
  5. 填空題
    屬於開放式問題,沒有答案選項。但提醒設計者,答案必須是數值,才適合做為衡量工具,另外,該類型亦不適用於詢問具個人隱私性質或需要精確記憶的問題。
    Mike 也與我們分享,現在多為電子化問卷,較少使用該題型,因為填空題容易出現錯誤值,在資料清理上較麻煩。
  6. 李克特量表
    常用來測量心理狀態的題目類型,如:同意程度、喜歡程度、重要程度等。
    而答案等級個數之決定,通常分為五、七或九個等級,偶數等級則較少見。原因在於奇數等級具有中間程度,而偶數等級則可能迫使填答者選邊站,扭曲內心真實的回答;同時奇數等級也更符合區間尺度對於等級間距相等的要求。

問卷回覆 4 大衡量尺度

所謂的衡量尺度,是將消費者回覆定義為數值的規則。

  1. 名目尺度 Nominal Scale
    又稱類別尺度,用以辨識或歸類而指定的數值,其數值無大小之分,無法進行四則運算,如:12 星座、性別等。
  2. 順序尺度 Ordinal Scale
    又稱等級尺度,係指用以排序而指定的數值,代表衡量結果的先後、強弱、等級等關係,如:給予填答者地點選項,1 代表最常去、2 為次常去的題型。
    但 Mike 提醒社員,學生製作簡報常常誤用順序尺度,若要使用請不要將結果任意加總,因順序尺度的等級之間距離不等,即喜好程度不等,無法進行四則運算。
    若需要進行後續運算,建議製作成李克特量表,並假設選項間的距離相等,以進行後續分析。
  3. 區間尺度 Interval Scale
    又稱等距尺度,用以表示所測事物間的相對差異程度。其等級間的差異皆為等距或假設等距,且數值具有連續性質,能進行加減運算;而李克特量表就是最常用來衡量態度的題型,通常被假設為區間尺度。
  4. 比率尺度 Ratio Scale
    又稱比例尺度,用以表示所測事物間的實質差異程度。與區隔尺度不同的是,此尺度具有絕對原點的性質,數值 0 代表無或沒有,因此數值可以進行運算。
    題型像是,請問您一週喝幾罐即飲包裝咖啡呢? 答案可能從 0 - 數瓶,因此比率尺度是精確度最高的衡量尺度,但受訪者可能會為了避免皆露太多訊息或因為記憶不明確,而降低填答意願。

在實務上可能為了提升受訪者的填答意願,而採用較低層級的區間尺度設計答案選項,而不採用最精確的比率尺度。

問卷品質監測機制

  1. 問卷發放前
    Mike 給與社員許多問卷設計的實務建議,像是建議使用有紀錄填答時間的問卷平台,並在問卷設計幾題篩選題來判斷填答者是否有效,常見如反向題(設計與原始題目內容相同,但命題為反面);問卷有針對特定群體的話,應該在第一題就篩選掉,並結束問卷;在設計問卷抽獎誘因時,也要考量其有效性…等。
  2. 問卷蒐集後
    如同前述,不僅根據先前測試的平均值進行篩選,也要看填答分布判斷;同時也要透過填答行為判斷該樣本是否有效,像是都填一樣的數值、有規律的交叉填答、或與題目無關等,區分問卷的有效性。

問卷設計流程

專業的問卷,通常會透過前測問卷,用較大量的題目,篩選出潛在客群相較關注的議題, 並檢查該問卷的信效度,以在正式問卷中,篩掉多數較不重要的內容。

舊議題研究的問卷設計流程
舊議題指已有相關研究報告之議題,因此,可以從文獻中找到驗證過的問卷題目。

舊議題研究的問卷設計流程

新議題研究的問卷設計流程
新議題指無可參考研究報告之議題。

新議題研究的問卷設計流程

學生務實版問卷設計流程
學生版的問卷相較研究問卷,會採用能短時間得到結果的方式進行,所以並不會製作初稿問卷,正式問卷的生成方式,可以採用不同的方法,而不用每個方法都使用。

學生務實版問卷設計流程

問卷信效度

效度 Validity
衡量工具可如實反映所欲衡量標準的特質的程度。
例如,尺衡量「長度」具有高效度,但是衡量「重量」具低效度甚至是無效度。

信度 Reliability
指衡量工具的重覆衡量結果具有一致性與穩定性的程度。

舉例:
在沒準備的情況下,小明 2 個月考 6 次多益的成績為820、780、815、830、800、790 分數差不多,表示多益信度高。

如果小明多益考 950,卻無法跟外國人對答如流,代表多益對英文口說不具有效的衡量。

信度與效度

量表的效度
係指具體的量表題項能夠真正衡量到,該量表想要衡量的抽象構念之程度。

內容效度 Content Validity
係指量表的內容適切性,亦即涵蓋抽象構念的程度。提高內容效度方法包括:
1. 仔細的從過去文獻找尋合適且相關的衡量題項或量表。
2. 初步決定衡量題項之後,請專家判斷是否適當。
3. 針對研究對象抽取少數樣本,實施量表前測,藉此檢討題項語意是否清楚,對用詞加以修正。

量表的信度
係指使用相同的量表題項,針對相同受測者重覆施測,每次得到的衡量結果的一致性或穩定性。評估指標有:
1. 再測信度 Retest Reliability
在兩個時間點,分別使用相同題項詢問相同受訪者;兩次衡量結果的相似程度愈高,信度就愈高。
2. 折半信度 Split Half Reliability
設計兩份相似的量表題項在同一張問卷上讓受訪者填答,兩兩對應題項的相關程度愈高,信度就愈高。
3. Cronbach’s α係數
0 — 1的值,相當於量表題項之間的平均相關程度,相關程度愈高,信度就愈高。係數 ≧ 0.6,即可宣稱量表之信度勉強及格。理想是至少 ≧ 0.7。

量化模型運用 - 市場調查分析

市場行銷議題

行銷是什麼? 如何賣對的東西給對的人

而行銷的範疇相當廣,假設你的公司今天要進入罐裝咖啡市場,可以透過市場調查研究市場現況;透過集群分析研究有哪些消費者,並將他們分群;亦可以透過產品知覺圖,進行既有品牌分析…等

這邊 Mike 也與我們分享行銷規劃程序。

市場行銷規劃程序

市場行銷基本概念

研究過程
針對不同的行銷情況,會有不同的目標,也適用不同的研究方法,以下即為各行銷情況,可能適用的方法。

研究方法適用情境

市場區隔
消費者的異質性 (Heterogeneity):市場上每個消費者的消費動機、習慣等都不同,對於價格變化和行銷活動亦有不同的反應。

市場區隔的難題:找到相對同質性的消費者,並採用適當的方法,將消費者異質性歸類成少數確立的群體,但是消費者的行為差異,在實務上並不容易明確分群。

市場區隔變數

  1. 人口統計變數 (Demographic Variables):性別、所得、年齡等,像是以年齡,區隔出童裝市場
  2. 心理統計變數 (Psychographic Variables):人格特質、生活型態、動機等,像是以購買動機,區隔出奢侈品市場
  3. 行為變數 (Behavioral Variables):時機,像是餐廳推出防疫期間外帶特餐,就是以「時機」來區隔市場

Mike 亦分享,東方線上的消費者行銷資料庫,有許多可以參考的調查資料,但報告內容必須付費唷!

STP 市場區隔
STP 是企業在一定的市場細分的基礎上,確定自己的目標市場,並找出產品或服務的定位。

STP 市場區隔

S 市場區隔 (Segmentation):根據消費者需求上的差異,把某個產品或服務的市場逐一細分的過程。

T 目標界定 (​Targeting):企業從細分後的市場中,選出決定進入的目標市場,也是對企業進入最有利的市場。

P 品牌定位 (Positioning):在營銷過程中,定位出產品或服務在目標市場的位置,即確定自家產品或服務在目標市場上的競爭地位,亦稱為「競爭性定位」。

市場調查問卷內容

Mike 再次提醒問卷設計前,必須要先進行市場分析,像是設定市場範圍,找出品牌最關鍵的競爭對手、通路或媒體等,都有助於企業聚焦;同時,也要進行總體環境分析、市場特性和消費者行為等研究。

產品使用與態度研究 (U&A ; Usage and Attitude)
是最常見的一種行銷研究方法,主要的研究內容包含,品牌認知現況、品牌態度、通路購買行為等,目標是…

  1. 了解消費者購買行為與動機,找出能打動消費者的策略
  2. 分析消費者對競品的態度,區隔自家品牌與他牌的定位
  3. 找出消費者偏好的品牌特徵,像是容量、價格、外型等,作為設計產品與服務的參考

如何製作 U&A 問卷
在此環節,Mike 透過實際的問卷,與社員進行問答互動,讓我們更了解問卷設計的方式,問卷各部分的含意與分析的可能。

高階統計模型介紹與應用

主成分分析
是一種合併相似變數的降維方法。

為什麼要合併變數?
1. 便於解讀,因原先變數太多看不出規律
2. 變數間有高度共線性,回歸方程式無法運作
3. 多變數分析前降維方法

主成分分析產出的 3 個特點
1. 代表性:保有原有變數的資訊,但並非完全保留
2. 獨立性:主成分間不能重疊,就是統計說的獨立變數
3. 精簡性:以少數主成分代替原來多個變數

合併後的新變數,能代表全部被合併的變數嗎?
無法,而理想的解釋率是 80% 以上,即可以用一個變數,來表示其他變數們 80% 的特徵

舉例:咖啡問卷
Mike 透過實際的問卷進行演練,發現該問卷中,原有的 3 個題目的相關係數高,此時即可使用主成分分析,將其合併。而合併後的解釋度有86.5%,代表新的主成分 (新變數) 可以代表這三個題目的 86.5%,相當足夠!

針對社員們提問,為什麼是將 3 個變數合併成 1 個,而非 2 個呢? 其實當我們進行 SPSS 主成分分析時,放幾個變數進去,就會產生幾個主成分,然而在結果中,第一個變數的解釋性以達 86%,代表一個變數的解釋性已經相當足夠,所以不用用到 2 個和 3 個變數。

因素分析
找出變數們的背後共同因子的降維方法。

為什麼要使用因素分析?
消費者的行為層面或心理層面是相當複雜且多變的,因此,需要在問卷中建立大量,且彼此相關的題項予以衡量,如:品牌忠誠度、購買動機、生活型態等。

而這些問題的目標,就是要找出消費者心中潛在動機。這些具高度相關的題項,背後隱藏的可能只是「少數幾個」具代表性的構面或變數類別。

舉例:咖啡問卷
該問卷中,使用 14 個題目確認,消費者的購買動機,然而在這些題目背後,應該只有某幾個因素,可以涵蓋所以用戶的動機。

Mike 亦與我們分享其因素分析的結果,像是在因素萃取報表中,可以發現刪除低共同性的獨物題項,重新進行因素分析,可以提高共同因素的累積解釋變異量百分比。

另外,在因素分析時,將原先可能隱含相似動機的題目歸納至相同因素之中,例如:將「吃甜點搭配咖啡」和「吃早餐搭配咖啡」,歸納至「搭配分享動機」的因素中。最終歸納完畢後,可以發現留下來的 4 個因素,累積解釋度達原先 12 個因素的 70%。

而 Mike 亦補充,在進行因素分析時,有兩個題項的共同性低於 0.5 ,因此,兩者皆為獨特題項 (兩個獨立因素),不宜納入因素分析。

最後,針對消費動機的因素分析結果,有助於問卷設計者建立市場區隔,並確保同屬一個區隔的消費者,具有相似的消費行為。

主成分分析 v.s. 因素分析

因素分析 v.s. 主成分分析

因素分析輸出結果:國 = 0.9 * F1 + 0.2 * F2 / 數 = 0.3 * F1 +0.9 * F2 ... 等

主成分分析輸出結果:主成分 1 = 0.8 * 自 + 0.9 * 數

集群分析 (Cluster Analysis)
又稱快速集群法,是一種多變量分析方法,其目的是依據樣本在一組集群變數上的異質性,建立數個群別。最常見的是 K 平均法(K-Means Algorithm)。

K 係指集群分析產生的群別個數,必須在事前設定。在給定K值的條件下,先將 n 個個體任意分為 K 群,然後個體會在各群間移動,其目的是使群內變異達到最小,群間變異達到最大。

在重覆求解的過程中,每個個體都可能離開原來群別到其他群,直到各群穩定,個體不再離開所屬群別為止。

Mike 也分享, K-Means 常常是不斷測試的過程,看什麼樣子的分群是讓結果符合邏輯的,再使用 K-Means 建立完分群後,還是要透過敘述統計學,找出更具體的樣貌。

界定現有目標市場
較直觀簡單的方法是,根據不同市場區隔於特定品牌忠誠度的比較,挑選平均數顯著較高的市場區隔。

較複雜但較準確的方法是,同時探討多個顧客特質對於品牌忠誠度之影響,挑選出具有正向影響的顧客特質。

品牌知覺圖
是消費者對某一種類產品中的各品牌,知覺和偏好的形象化,圖表也常用來呈現企業在該產品中的市場定位。

品牌知覺圖

在個案的環節 Mike 也不藏私的與社員分享,過去商業競賽得獎作品,從如何設計問卷、如何運用上述的統計模型分析問卷、如何運用分析的結果找到目標客群或建議策略等。

最後,非常感謝 Mike 人在國外,仍承受著嚴重的時差,為我們帶來如此精彩的一堂課!相信透過這堂課,社員在未來的專案或是商業競賽中,都能設計一份具有參考價值的問卷,並有效運用問卷這個工具,產出結論與決策建議。

歡迎各位讀者拍手交流,NTUDAC 也會持續在 MediumFacebookLinkedIn 更新每週社課的資訊,歡迎對資料有興趣的大家持續關注,跟我們交流想法~

--

--

NTU Data Analytics Club
NTU Data Analytics Club

臺大資料分析與決策社 (NTUDAC) 為一群對資料科學抱有熱忱的臺大學生創立, 旨在教授學員如何利用數據分析解決商業問題的商業性社團,在 Medium 將分享社團課程與實作專案內容,以期推廣資料分析的相關資訊。