語音助理面臨的挑戰:以Google Home為例

陳美伶 Mei | 伶魂洞察
Mei-Ling Chen
Published in
7 min readMay 13, 2019
photo credit: www.nextdayblinds.com/
此篇文章於2018/06/08 同步發布於「人機共生你我它

由Google推出的智慧居家助理Google Home,結合既有的智慧家庭設備加上第三方服務,期望替使用者帶來更全面性的智慧居家服務。Google Home第一眼看來就像是個喇叭。使用者只需要說句:「OK, Google」即可喚醒Google Home裝置,並可開始詢問任何你想要知道的問題,也可以替使用者安排每日行程。Google Home之所以強大是因為Google已提供了許多相當成熟的服務,例如:Google搜尋引擎Google地圖Google日曆等等。一旦綁定了自己的Google帳號,Google Home就像是替個人貼身打造的專屬助理,對於你的行程、習慣的交通路線瞭若指掌,奠基在原有強大的生態服務網之上,提供你適當的建議。看似方便的互動方式,卻潛藏著實際使用上的暗礁。

語音控制能降低使用者負擔?

透過語音指令的方式,直覺上,我們以為用習慣的對話方式和機器互動,得以節省許多學習操作的時間、能有效降低使用者的操作負擔。然而透過平常的對話方式,真的能夠順利和語音助理溝通嗎?當使用Siri時,我們可能會遇到指令辨識錯誤的問題,或是得到預期之外的回答。長期下來,多次操作失敗的挫折,讓使用者對控制產品的信心下降。這些意料之外的互動體驗,降低了使用者繼續使用語音助理的動機。

從唐納‧諾曼的設計原則來反思

改善使用者經驗,需要先了解使用者的想法,以認知心理學的觀點來說,人類對於外在世界的體驗來自於五官的感受;與產品互動時,人們同樣仰賴各個感官加上過去經驗來形成自己的心智模型(mental model),根據這些基礎,產品可以用許多 UX 方法進行設計上的改良。唐納·諾曼(Donald A. Norman)在《設計心理學》一書當中,指出那些以人為本的產品設計,注重功能容易被發現的「可發現性(discoverability)」、功能容易被理解的「易理解性(understanding)」以及介面屬性提供使用者操作提示的「預設用途(Affordance)」,接下來將分別以這三點,分析當前語音助理普遍面臨的挑戰。

可發現性:使用者容不容易進行功能探索?

目前市面上語音助理,大多無法讓人馬上發現有哪些功能可以使用,這就是可發現性仍不足的狀況。因此,很多人會開始自行探索語音辨識助理到底可以辦到哪些事情?常見的做法是在一開始問一些簡單的問題,例如:「今天的天氣如何?」或是「告訴我接下來的行程」。再者,有些使用者可能會開始叫它說個笑話或唱歌,試探系統的各種可能性。當然,這可以視為系統當中的彩蛋,藉由隱藏一些有趣的功能,在使用者探索的過程當中,不經意地給予驚喜。

筆者認為,可發現性的必要程度,依據使用者向語音助理所下的指令可大致分成任務目標導向或是娛樂導向。以目標導向來說,使用者傾向於快速且輕易地達成目的,並期望系統提供他們清楚的指引。至於娛樂導向,可發現性就相對變得不太重要,花上一些力氣來得到彩蛋反而可以增添樂趣。

可理解性:使用者如何理解系統運作?

和語音辨識助理互動的過程當中,如果它辨識錯指令或是不能理解所下的指令,我們就必須一再地嘗試,但卻很有可能發生不論怎麼嘗試都會失敗的情形。要成功的對語音助理下達指令,使用者必須要了解語音助理的能力所及範圍。但目前的語音助理設計,除了系統主動給予功能列表之外,接下來就只能靠使用者自身不斷的探索。在這個過程當中,系統給予的回饋卻時常只有「很抱歉,我並不能理解你所說的內容。請嘗試其他問法」。由於缺乏線索及回饋,我們無法從互動過程當中,理解系統為何會犯下這樣的錯誤,也無法去修正自己問問題的方式。

上圖為2017年所推出的Google Home Mini (Photo by John Tekeridis from Pexels)

預設用途:產品的展現,如何給使用者操作的提示?

與依附在手機裝置上的Siri不同,Google Home是一個獨立的喇叭型語音助理。在其頂端平面上有代表Google顏色的紅、黃、綠、藍四色LED燈,以及可供實際操作的觸控功能。啟動機器後,LED燈就會亮起並進入準備接收指令的待命狀態。輕觸即可暫停或播放音樂、順著圓圈方向的觸控手勢可調整音量。延續可理解性的討論,語音助理需要提供清楚的回饋,在Google Home的設計當中,LED燈能告訴使用者系統的運作狀況。但除了顯示狀態的平面外,我們並不會聯想到這是一個可以進行手勢操作的觸控式平面。

photo credit: https://www.flickr.com/photos/netzkobold/30498692180

藉由呈現介面屬性,暗示使用者可行的操作方式稱為預設用途(Affordance)。日常生活上常見的例子,像是喇叭鎖門把或是寶特瓶上的瓶蓋,都暗示了使用者可以藉由「旋轉」來操作該物體。對於熟悉科技的人,我們或多或少能感受到,這個Google Home頂端平面帶給我們的暗示,但對於不熟悉科技的人,這並不是會馬上聯想到的互動形式。

最後,一個值得我們再度思考的議題是,在極簡設計的推崇下,我們如何在簡單與複雜當中取得平衡?在提供足夠提示和線索來讓人理解的前提下,去除掉視覺上多餘的元素,讓使用者能發現他們需要的功能,也擁有流暢的互動體驗。

專業知識小百科

心智模型(mental model):人們內在如何思考,以及對於外在事物如何運作的理解。

唐納·諾曼(Donald A. Norman)在《設計心理學》一書當中,對心智模型的實際案例,舉出如下圖的情境:開發產品時,設計師可以透過「系統印象」來和使用者溝通,使設計師的概念模型與使用者的心智模型一致。意即「概念模型」作為設計師對於產品的設計概念,及產品如何使用的闡釋,可以藉由「系統印象」也就是產品的說明及物理屬性所表達的形象,來影響使用者的思考模式與操作邏輯。

(圖片來源:Donald Norman;圖片繪製:本文章製作)

延伸閱讀

參考資料

--

--

陳美伶 Mei | 伶魂洞察
Mei-Ling Chen

UX Researcher。熱愛探究科技在個人與社群中扮演的角色。期望科技的力量能支撐起良性溝通的橋樑。📬 聯繫我:mia.meiling.chen@gmail.com