聊聊易用性測試(Usability testing)

Hugh L
Thinkinglab
Nov 3, 2020

--

不管你是剛踏入 UX 領域的初心者,或是入行多年的資深 UX 工作者,相信對易用性測試 (Usability testing) 的概念應該都不陌生。不過,如同其他工具一樣,在理論與實作之間總是存在著或多或少的落差,所以這篇就讓我們聊聊暗藏在 gap 中許多如人飲水般的眉眉角角。

首先,關於易用性測試的定義與價值,不免俗的來看看維基百科怎麼說:

易用性測試是一項通過用戶的使用來評估產品是否滿足用戶需求的技術,由於它反應了用戶的真實使用經驗,在用戶體驗中扮演了及其重要的一環。也就是說,實用性測試是指讓用戶使用產品(服務)的設計原型或者成品,通過觀察,記錄和分析用戶的行為和感受,以改善產品(服務)使其更加貼近用戶習慣。

簡單來說,不論你是PM、設計師還是工程師,開發團隊皆非使用者。因此,有效且循環的做易用性測試不僅可以快速更新設計師的產品原型、也能確保資訊架構 (Information Architecture) 讓使用者迅速上手,設計師更可以引導產品設計往使用者中心為走向,避免變成 PM 走向或是開發難易走向,這也是易用性測試的價值所在。

如何規劃一場完整的易用性測試?

一般來說,一個基本且完整的測試可以大致分為四個步驟:「定義目標」、「招募受測者」、「測試與觀察」、「結果分析」。下面我們一一說明。

定義目標

依據要測試的產品階段或目的,易用性測試可以分成三類:

  • 探索性測試:在發布新產品之前,探索性可用性測試可以確定新產品應包含哪些內容和功能,以滿足用戶的需求。在產品開發早期,探索性可用性測試可以評估初步設計或原型的有效性和可用性。
  • 評估性測試:在發布前或發布後對最新版本的測試,通過評估性可用性測試向用戶介紹新設計,以確保其直觀使用並提供良好的用戶體驗。評估性可用性測試的目的是 — — 確保在產品推出之前突出並修復任何潛在問題。
  • 比較性測試:比較兩種或更多種產品或設計的可用性,並區分各自的優缺點,以確定哪種設計能提供最佳的用戶操作體驗。

無論使用哪一種類型的易用性測試,都需要事先定義主要測試的目標,並且依照目標來制定3~4個測試任務,讓受測者透過執行這些任務展現我們希望觀察的行為,並且藉此進行評估。舉例來說,電商產品的測試任務可以是「進行商品關鍵字搜尋並篩選目標商品」,而在這項任務中我們可以透過「找到搜尋按鈕」、「輸入關鍵字」、「使用篩選功能」、「搜尋」、「閱讀搜尋結果」等階段性動作來評估這項任務的完成度。

小眉角:在開始測試任務之前,先給受測者一個想像的背景情境,將能大幅度的幫助受測者快速進入狀況,也有助於判斷在真實情況中他們會怎麼下決定。另外,先讓受測者進行簡單的任務,避免他們一開始就感到挫折而放棄。

招募受測者

當然不能是轉頭看到誰就抓來測。受測者必須是符合目標群體特徵的人,也就是實際上會使用你家產品的的使用者。這時候,一份簡單的前測篩選問卷能夠幫助你更準確地找到對的人,透過年齡層、職業、產業、使用科技狀況等問題設定,提高準確性,而不再只是耐心等待仔細尋找感覺很重要。

那要找多少人才夠?根據 Nielsen Norman Group,五位正確篩選的受測者回饋就足以涵蓋百分之八十五的問題,在那之後超過這個數字得到回饋邊際效應就會開始遞減,如下圖所示。所以通常會建議受測者人數落在6~8個左右就非常足夠了。

邊際效應曲線

小眉角:使用前測問卷的另一個好處是能夠順便當成訪談意願調查表,節省重複確認的時間。受測者的選擇會直接影響到測驗的準確度,務必小心謹慎,畢竟你不會希望把車馬費花在那些連自己都不知道自己來幹嘛的人。

測試與觀察

前置作業規劃好、受測者也到了,終於可以開始測試了。在受測者確實了解本次易用性測試的目的與進行方式並且簽署同意書之後,便可開始進行。在測試中必須記得幾個重點:

  • 最小限度干涉:易用性測試的重點是觀察受測者如何完成任務,因此在這樣的前提下,請不要一直去提示、引導或糾正受測者。不過,若是發現受測者在某個步驟卡死,這時候可以依照當時情況適度地給予幫助。
  • 放聲思考法:總是與易用性測試一起服用,受測者需要操作指定任務同時將心中任何的想法講出來,包含他們看到了什麼、想到了什麼、感覺如何、要怎麼做等等。
  • 紀錄觀察:紀錄是易用性測試中非常重要的一環,必須忠實紀錄受測者在測試中所發生的各種行為,例如停頓、重複錯誤、皺眉、A-ha moment…等,並且在結束測試的訪談中與受測者進一步討論。

小眉角:在不熟悉的情況下,受測者通常很難持續進行放聲思考法,需要靠施測者不斷的提醒,因此正式開始前可以用模擬演練的方式,例如請受測者回想一下他家中有幾扇窗戶並一步一步說明,透過這樣的練習讓受測者習慣放聲思考模式。

結果分析

上述的步驟結束後,我們便可進行結果分析,分析時測量數值的意義因產品的不同而有不同,人機互動專家 Jakob Nielsen 將可用性框架的定義為:

  • 可學習性:初次接觸這個設計時,用戶完成基本任務的難易程度?
  • 效率:用戶了解了設計之後,能多快地完成任務?
  • 可記憶性:一段時間沒有使用產品後,是否能輕鬆地恢復到之前的熟練程度?
  • 錯誤:用戶犯了多少錯誤,錯誤嚴重程度如何?用戶能否從錯誤中輕易地復原?
  • 滿意度:用戶對產品的主觀滿意度,這個設計讓用戶感覺如何?

而在易用性問題的處理上,首先需定義問題從開始到結束為何,了解是什麼原因導致問題的發生,接著以問題發生的頻率與嚴重程度來決定優先處理順序。

另外,使用者主觀上的滿足,來自於使用產品後的整體印象,因此通常為使用後施測。要注意的是,產品的比較性質必需一致,不同的產品來比較是沒有意義的。

SUS (System Usability Scale) 量表,是目前比較多人使用,來測量使用者滿足的五點量表,題目共有10題:

分數計算方式,奇數題為正向題,將各題分數減一為最後分數,如若為3分計算結果為2分;偶數題為負向題,以5分減去該題分數為最後分數,如若為4分計算結果為1分。各題分數計算完畢後,將所有分數加總乘以2.5,即得到總分。一般來說,SUS的平均分數為68分,可以把這個分數視為產品及格分數。

整體而言,要檢視哪些指標,主要看產品本身的目標與性質而定 ; 有了指標的數值後,可以進行調整後再測試一次,並將前後版本的數值對照來看是否有進步。

結論

易用性測試對 UX 工作者來說算是一項常用且基礎的概念工具,針對不同類型的產品也會需要不同的測試以及分析方式,重點在於你是否了解如何適度地做彈性調整來設計出最適合的測試方式。工具只是招式,能夠靈活運用才是最終目標。

--

--

Hugh L
Thinkinglab

UXer with cognitive psychology background. Always learning to enjoy life.