UX研究中的評分量表:李克特(Likert)還是語意差異(Semantic Differential)?

Yueh Ting Wu
UX 萬事屋
Published in
Aug 31, 2021

(本篇翻譯自NN-Group:Rating Scales in UX Research: Likert or Semantic Differential?)

目錄:
1. UX專業人士如何使用評分量表問題?
2. 李克特量表(Likert Scale)
3. 語意差異(Semantic Differential)
4. 李克特與語意差異的比較
5. 在UX調查中使用評分量表的技巧
Photo by Tumisu on Pixabay

摘要:李克特和語意差異是用來決定使用者對產品、服務和體驗的態度的工具,但根據你的情況,其中一個可能比另一個更好用。

Likert and semantic differential are instruments used to determine attitudes to products, services, and experiences, but depending on your situation, one may work better than the other.

李克特量表和語意差異量表是UX調查中常用的兩種評分量表。因為兩者之間細微的差異導致他們經常被搞混。然而,他們以略微不同的方式解釋了人們的態度和偏好。

UX專業人士如何使用評分量表問題?

我們經常使用評分量表問題來衡量態度、知覺、信念、偏好和自我陳述的行為。這些類型的問題允許有不同程度的意見

評分量表問題出現在各種研究方法中。當然,評分量表問題最常被應用在調查(survey)中。然而,在量化的可用性測試(usability tests)中也經常使用評分量表問題,其所產生的與態度相關的數據有助於我們理解使用者如何感知我們的產品或服務,以及他們如何執行給定的任務。這些數據為我們提供了更豐富的整體使用者體驗的視野。

李克特量表(Likert Scale)

李克特量表(Likert scale,發音為Lick-urt)是以心理學家Rensis Likert的名字命名的,他在20世紀30年代發展出李克特量表法。

李克特量表衡量一致性(agreement)。在李克特量表中,受訪者被問及對一組陳述的同意或不同意程度。在分析了所有相關問題的回答之後,就會得出一個總體的立場。易用性評估問卷(Usability assessment questionnaires),如System Usability Scale(SUS)和Standardized User Experience Percentile Rank Questionnaire(SUPR-Q)使用李克特量表。(從技術上來說,一個問題本身並不是一個李克特量表,而是使用李克特型回答格式的問題。一個單獨的問題被稱為一個李克特問項。)

The System Usability Scale (SUS) questionnaire uses a Likert-type scale, with 5 response points for each item. SUS asks respondents to select whether they agree with 10 different statements. Questions 1–3 from the SUS questionnaire are shown above.

李克特量表(以及李克特式回答格式)容易出現兩種回答偏誤

1. 默許偏誤(acquiescence bias)

2. 社會期望偏誤(social desirability bias)

1. 默許偏誤是指人們傾向於同意他人的觀點。這種現象並不奇怪,畢竟同意是我們的天性。默許的發生是因為參與者被積極(或消極)的陳述所促發,他們必須同意或不同意。這類型的行為是框架效應的一個例子-當一個情境的積極(消極)面被強調時,人們傾向於把整個情境看作是積極(消極)的。

避免這種問題的方法是將正面語句與反面語句交替使用。舉例而言,SUS問卷在正面和反面陳述之間交替使用(如上圖所示)。然而,採取這種方法並非沒有困難。Sauro and Lewis (2011)發現,交替使用正面和反面語句可能會導致參與者和研究者的混淆 (參與者可能沒有仔細閱讀語句以注意到這種交替;而研究者可能沒有意識到,對正面和反面問題的回覆必須以不同的方式編碼,比如需要反向計分)。

2. 社會期望偏誤是指希望報告的觀點能得到他人的贊同。當受訪者感覺到有一個被接受的立場時,他們會更傾向於同意這個立場,因為擔心不同意會給自己帶來不好的影響。(舉例來說,如果人們認為政治正確是公認的立場,他們可能不願意報告與此觀點對立的個人態度。)為了減少這種偏誤,不要要求受訪者提供姓名及其他識別資訊。研究人員發現,在調查中詢問姓名及其他識別資訊會增加社會期望偏誤。

語意差異(Semantic Differential)

語意差異問題是1975年由Osgood、Suci與Tannenbaum在《The Measurement of Meaning》一書中提出的,此後流行起來。

語意差異問題要求受訪者透過在雙極性形容詞量表上選擇一個位置來評分他們的態度。尺度的兩端主要是反義形容詞(如:醜-美、容易的-困難的)。The Single Ease Question (SEQ)是語意差異量表的一個例子。SEQ採用7點量表,兩端分別標示為“非常容易”和“非常困難”。

The Single Ease Question (SEQ) is an example of a 7-point semantic differential. The two bipolar ends describe the ease of interaction for a given task.

在大多數語意差異的應用中,可以沿著連續體選擇的選項是沒有被標籤的,因為它們被認為代表抽象的點。但是,如果中間點被編號(如-3-+3)或被標籤為非常、有點、既不是也沒有等詞,則存在差異。

雖然研究發現,與沒有標籤的量表相比,人們更容易理解有文字標籤的量表,但要想出一個正確的詞來描述量表的中間點是困難的。

語意差異問題所產生的數據只有在滿足兩個假設的情況下才可信。這兩個假設是:

1. 這對形容詞是真正的兩極。然而,不可能總是找得到完全二分法的對比形容詞。

2. 受訪者能了解詞對之間的二分法以及在它們之間的連續體。然而,由於量表沒有被標籤,每個選項在多個受訪者中可能會有不同的解釋。

李克特與語意差異的比較

雖然這兩種評分量表都考慮了意見的程度,但它們之間存在著細微的差異。回答語意差異比回答李克特量表問題需要付出更多的認知努力,因為受訪者必須對自己的態度進行抽象的思考才能選擇一個選項,最主要的原因是量表上的點是沒有標籤的。然而,選擇的認知彈性性意味著受訪者不會被特定的標籤所困,而李克特量表則可能會出現這種情況。

下表比對了這兩類問題間的一些差異。

在某些情況下,對於一個給定的研究問題,有可能使用李克特問項或語意差異。例如,如果想了解我們的網站在使用上有多令人滿意,我們可以詢問使用者對“網站的使用是令人滿意的 ”這句話的同意或不同意程度。我們也可以建立一個語意差異問題“使用網站的滿意度如何”,量表的兩極包含“滿意”和“不滿意”這兩個詞。這兩個問題都有助於我們了解使用者對網站易用性的看法。

但是,有些情況下,很難或不可能使用語意差異。比如,考慮一下以下陳述,這些陳述是以李克特量表的形式呈現在UX從業者的調查中。

  • 在完成探索之前,我們不會開始思考解決方案。
  • 在我們開始設計新功能、產品或服務之前,我們有足夠的時間進行探索工作。
  • 參與探索的團隊都一起協作、分工。
  • 我們的探索是圍繞著目標使用者所進行的使用者中心研究。

如果不改變我們試圖從受訪者那裡獲得的資訊類型,就不可能把上述內容轉換為語意差異。

因此,總的來說,使用李克特式回答格式的問題更加彈性,且應用也比較多。

在UX調查中使用評分量表的技巧

如果你正考慮在你的調查中使用評分量表,那麼這裡有一些技巧。

• 如果你想評估界面的易用性,請使用標準化的易用性問卷而不是自己創建,這些問卷已經被試驗與測試過,並且是經過心理測試的。

如果你不確定該使用哪種類型的評分量表,那就兩種都測試一下。做一個面對面的量化調查以測試對問題以及答案選項的理解。讓你的使用者在完成調查時放聲思考(think aloud)。你也可以測試兩種版本的調查問卷,並比較回答,以決定該使用李克特量表還是語意差異量表。考慮一下受眾:人們會在回答一個語意問題時感到費勁,還是他們會有過於認同的傾向?

• 使用李克特式的回答方式設計問題時,使用現有的尺度標籤。堅持用常見的方式來表達同意和不同意(非常同意、同意、既不同意也不反對等…),而不是多此一舉,創造新的回應選項。

• 在設計語意差異量表時,確保你的極性形容詞是真正相反的。例如,選擇像“有趣”與“無聊”這樣被廣泛接受的配對,而非像“酷”與“奇怪”這樣奇特的配對。在執行大規模的量化調查之前,先親自與使用者測試,以了解詞對搭配是否被視為兩極。

把可自由選擇的文字編輯框加入以獲得更多的洞察力。像是一個“你為什麼選擇這個評分?”的問題,可以蒐集到在量表上選擇一個選項背後的思考過程。

• 對於一些可能不適用於所有受訪者的問題,增加一個不適用的選項。這個額外的選項可以幫助你從那些認為問題與自己無關的受訪者中消除任何無意見的回答。

結論

李克特量表和語意差異量表是UX研究中常用的兩種評分量表。兩者都是經過試驗和測試的方法以用來衡量與產品和服務體驗有關的意見程度;然而它們的方式略有不同。選擇適合你研究目的的評分方式,並注意兩者的侷限性以及細微差別。

小記

身為一個社會科學領域的研究生,相信各位在選擇研究工具時常常會碰到困難,如果你也曾被Likert Scale跟Semantic Differential所困,時常看著它們卻始終疑惑我是誰我在哪我為什麼在這裡,甚至問過教授與身邊的同學為何要用7點而非5點量表,別擔心這是正常的,看看這篇比較,希望能夠造福同是身在研究苦海中的各位朋友們!

大家好!我們是一群喜愛閱讀的設計書蟲們🤓,定期舉行讀書會討論與分享國內外新知,在閱讀的同時希望可以將知識紀錄下來並分享給大家。如果喜歡這次的分享,但覺得有改進空間,請用1-10個👏鼓勵我們
如果覺得本文有幫助,對用戶體驗有更明確的理解,請用10~30個👏支持我們
如果想看本文的延伸主題,例如相關應用等,請用30~50個👏提示我們
若是單純想給我們加油打氣(或是表示已讀),就請快樂的隨意👏👏吧!最後,謝謝你的閱讀!歡迎點擊下方的「Follow」追蹤我們,讓我們繼續把閱讀所帶來的滿滿收穫分享與你!

--

--