[好文分享] 語言學女博士跨界漫談:語音交互需要怎樣的設計師?

NathanChen
UXeastmeetswest
Published in
15 min readJan 13, 2019

--

本文適合(1)初進入 UX 領域 1~3 年的 Designer(2)喜歡探索和了解新領域的 Geeker(2)近期對 CUI/VUI 有興趣的 Anybody

長期關注 UX 四神湯的讀者們,應該知道 Nathan 目前正在阿里巴巴天貓精靈智能音箱設計團隊。前一陣子與大家分享了許多從體驗設計師角度,談如何進行 Conversational UX Design 的文章。

也曾經在 2018 年 MIX 大會的工作坊,與大家分享了在實際工作中,如何帶著 UX Design 設計思維,去設計一款語音產品。

如果還沒看過 Nathan 之前語音設計的相關文章,再開始這篇文章前,也可以先看完,再開始閱讀本篇文章,會有更完整的理解喔!

本次 Nathan 推薦團隊中,有著 8 年語言學專業經驗的設計師 — 婉語,看看結合語言學專業進行語音體驗設計師的沉澱總結文章。了解由語言學領域出發的語音設計該是什麼樣子的。

妙語匠心—智能語音交互的設計探索與實踐

8 年語言學背景的婉語,在語言學博士畢業後加入阿里巴巴國際 UED,從語言學研究領域跨界到語音交互設計領域,參與設計的項目包括公共服務領域的大屏語音設備以及家庭私域場景的智能音箱。

自從計算機誕生以來,人機的交互手段,經歷了鍵盤、滑鼠、觸屏等階段。交互方式的每一次的演化都向著更便捷、更自然、更趨近於人類本能的方向前進。新一次的交互革命已經開始,結合人類“五感”的多模態手段,成為未來產品的新趨勢。

在聽覺、視覺、觸覺、嗅覺、味覺 5 個通道中,聽覺通道無疑最為重要。語言是人類傳遞信息、交流溝通的最主要手段,對於用戶來說,語音交互的學習成本最低,也最為自然。

同時,在很多場合中,語音可以解放我們的雙手,允許用戶同時處理多個任務。語言還是人類智能的象徵,在人類的幻想中,一旦某種生物獲得了人性,首先它就會 “開口說話”。因此,用戶對於人工智能直觀感知就是語言能力。可見,要想在自然交互、情感交互的體驗上取得突破,語音能力必須先行。

在經過一年多的探索和實踐後,她將從語言學的視角,談一談在項目中的經驗沉澱與設計方法,希望能為同類型設計師、跨界設計師、UXD 設計師帶來一些不同的靈感。

作為語音交互的核心,人的「語言能力」顯得格外重要。自然語言的會話結構是怎樣的?在口語中,人是如何表達意圖的?人的對話策略又是怎樣的?這些語言學問題都與語音交互設計直接相關。

01 在語音交互中,如何分析用戶的意圖?

產品的本質是滿足用戶需求,“以用戶為中心” 的視角永遠不會改變。因此,在人機交互發展的任何階段,都需要體驗設計師。

技術只是一種手段,如何讓技能能力服務於用戶、如何讓用戶在交互過程中獲得良好的體驗,這是設計師的天職。設計師搭建起了技術與用戶之間的橋樑。

從技術層面來看,語音交互過程就是將用戶的語音信號轉化為文本,再對文本進行語義理解,觸發不同領域的服務、內容、信息等,並以合成的人聲反饋給用戶,形成對話式的交互。

1. 分析用戶需求

語音識別技術能夠將人的語音轉化為文本,計算機通過分詞、parsing(句法分析)等方式理解文本中詞與詞的關係。但是,在真實世界中,用戶語言和用戶意圖之間的關聯卻是很複雜。在語言學上,我們稱之為 “會話隱含意 (conversational implicature)”。

這種語義高度依賴語境,具有不確定性,無法通過分析語法和詞彙而得出。這樣的用戶需求無法完全依靠計算機的能力進行解析。

以最簡單的天氣問詢為例,“今天出門要帶傘麼?” 對男性用戶來說,關注點可能是天氣的降雨情況;對女性用戶來說,關注點可能是天氣的日曬情況;如果當下的天氣狀況是烏云密布,用戶意圖大概率上又是詢問降雨。

這時,就需要設計師構建細緻的判斷邏輯,輔助計算機進行語義理解。

2. 設計對話體驗劇本

正如前文所說,只有得到符合預期的反饋,用戶才會認為計算機理解了自己的意思。

用戶對於對話式交互的預期來源於生活經驗,因此,計算機的反饋話術則需要具備 “人格化 (impersonated) ” 的特徵。所謂 “人格化” 的話術需要具備三點特徵:

01 符合統一的人格設定和語言特徵;

02 符合自然語言的會話結構和邏輯;

03 符合對話場景中的交際習慣。

首先,語言是人類智能的象徵,用戶對語音產品會產生 “移情” 效應,不可避免地認為語音產品具有擬人的屬性。因此,設計一個語音產品之前,也應該為語音系統設定一個固定的人格類型,並設計具有一致性的語言體系,避免給用戶造成人格的 “分裂感”。

其次,自然語言中存在固有的會話結構。如,一個完整的對話結構必須具備 “開始模塊” 和 “結束模塊” ,跳轉話題時需要一個 “話題樞紐”。

“話輪樞紐” 可以用一個簡單的詞語來承上啟下,如 “對了……”、“其實……” 等,也可以是一個或多個句子來過渡話題,但少了這個部分,對話就會顯得生硬。不論是什麼類型的對話設計,都需要按照這樣的模塊細化展開。

最後,人在不同場景中,具有不同的語言行為特徵。如在公域中,更偏重效率和隱私性,因此公域的服務場景話題延展性較低,設計重心圍繞核心需求展開;而在私域中,則更偏重情感體驗,話題的延展性較高,設計還需考慮更多的交互細節。

02 在語音交互中,如何分析用戶的意圖?

刺激語言表達的來源有兩種,一種是說話人的內在感受,一種是客觀環境的外部語境。

那麼,要想知道用戶在語音交互場景中會「說什麼」,首先需要分析用戶是誰,即分析用戶畫像;其次要分析交互場景,除了空間時間場景外,多模態的交互界面也是場景語境的一種。除此之外,我們也能夠運用一些語言學上的方法來幫助我們在前期進行用戶意圖的挖掘。

1. 語言的替換組合原理

首先,語言是一個可以替換組合的裝置。

那麼,我們從一個典型意圖開始擴散,通過概念拆解,運用有規律的替換,可以發散出多種用戶需求,並為之設計具有針對性的回复模式。

如在“問天氣”這個簡單的場景中,最典型的用戶意圖是 “今天杭州天氣怎麼樣?”,但在現實中,用戶的需求遠不會這麼簡單。當我們對這個意圖進行拆解,將其中的三個組成部分「今天」「杭州」「天氣怎麼樣」進行有規律的替換和組合時,就會生成出複雜而眾多的用戶需求。

2. 真實口語中的語用規則

其次,中文口語常常的凌亂的,語法不嚴密的,口語的規則常常超出句子範圍,我們還需要考慮篇章結構的規則,這是語言學中的 “語用規則 (Pragmatic Rules)”。

例如,一般認為中文語法的名詞中心語是後置的,修飾語在中心語前面不斷疊加,如 “美麗的風景“、”旋轉的風車”,這稱之為 “向心結構”。以點咖啡的場景為例,理想的語法狀況為 “我要打包一杯大杯香草口味的熱拿鐵”。

但這類結構的句子在實際生活出現的可能性極低。在口語中,通常以“主題+描述性成分”展開,如“一杯拿鐵,大杯,熱的,加香草,打包,啊……還是冰的吧,那個……去冰”,呈現出 “離心結構” 的傾向。

口語中,語言是伴隨思考進行的,還受到思維邏輯結構的影響,這是跨句子範圍的 “語用規則”。人在提出需求時,通常遵循 “提出-補充-修改-澄清” 的邏輯。

因此,最核心的需求往往最先提出,隨後對需求進行細化描述。我們在語音點單機項目中,運用這種邏輯對何時截斷用戶的語音、何時執行指令、在遇到用戶停頓時應該如何處理,這些前端操作進行輔助優化後,用戶意圖的識別率和執行執行的正確率都有了較為明顯的提升。

03 如何設計符合用戶思維習慣的對話劇本?

1. 模擬真實生活的對話場景

人和人之間的日常對話,通常不是直接的功能性問答,也不是單一話題的,而是在不同話題間不斷轉換。

用戶對人機對話的預期也是如此,不是冷冰冰的一問一答,而是能夠能加自然真實。所謂的 “自然真實”,其實就是與用戶固有的思維習慣類似。

我們模擬日常生活中的對話場景,為 AI 人物建立「用戶生活參與者」的身份。以天氣問答場景為例,人和人之間關於天氣的對話,不僅是獲取資訊,還會基於天氣進行話題擴展。

因此,我們在對傳統的天氣播報進行了「場景話術包」的升級方案,在基礎信息模塊的基礎上還增加了人格話術模塊,依據天氣類型和氣溫類型,選取了語義網絡中高關聯度的節點作為話術維度,在基本的信息模塊基礎上,建立人格話術模塊,根據 A.I. 人物的性格設置編寫話術。這些維度包括,安全、出行、健康、心情等與用戶日常生活息息相關的方面。

這種場景話術包模擬人和人之間真實的交際場景,會給用戶帶來符合預期的對話體驗。

同時,在每次與用戶交互時,人格話術庫都能夠根據當下場景提供不同的對話內容,用戶能夠在每次對話中都能獲得一些新的體驗,從而引發用戶對再次交互產生好奇。

更重要的是,我們基於場景對用戶表達主動的情感關懷,營造出「生活參與者」的角色形象,為用戶構建起虛擬的人際關係,滿足用戶更高層的社交需求。從這三個角度,立體地塑造出具有 EQ 的機器語言,讓用戶的對話體驗更加生動有溫度。

2. 有邊界的聊天邏輯

傳統的聊天機器人是無邊界的,依賴於積累語料、標註數據、搭建知識圖譜等方式。

一般來說,這種回复內容的適用範圍很廣,不受語境的製約,在任何時候都能差不多兜住用戶的問題,給人一種似乎對、也似乎不對的感覺。但是這種交互沒有主題,也沒有記憶,完全基於用戶的上一句話術,這就很容易在對話過程中脫離語境,跳出用戶的預期。

而在自然語言的會話結構中,即使跳轉話題,也通常有話輪樞紐來承接上下文,整個對話始終是在雙方的預期中進行的。脫離語境會給用戶造成認知上的違和感。

以下是某聊天機器人與用戶的對話,這兩種情況都屬於用戶的預期外情況,當前話題就只能終結,用戶必須另起話題才能繼續。

於是,我們在小的垂直場景(詩歌領域)中做了試驗性的嘗試,採取另外一種 “有邊界” 的閒聊邏輯:

首先,這種交互是有始有終的,圍繞單一話題展開,通過機器的主動引導來完成整個流程,有獨立的開場模塊和結束模塊。

將詩歌能力結構化,變成獨立的技能模塊,進行主動輸出,例如猜詩人、猜詩名、詩歌對句、詩歌釋義、詩歌冷知識等,為每個技能模塊設置引導話術和對話模版。一個模塊作為一個技能進行主動輸出,並在主動結束前吸引用戶下一次再來進行交互。

用戶的每次交互都被記錄下來,作為下一次交互的話題,這樣,機器人和用戶之間就有了共同的經歷。

在這種有邊界的閒聊邏輯,具有上下文的強關聯性、同時場景明確、主題突出,當然也有相應的缺點,對場景強依賴、通用性低。從交互平均時長的絕對值來看,也許低於無邊界的聊天機器人。但是,在相對較窄的垂直應用場景中,如游戲和教育,這種思路的閒聊機器人也許會有更強的適用性。

這種閒聊模式是半封閉的,「開場——引導——技能——結束」是一個完整的 happy path,但是用戶的思維具有發散性,很可能由現有語境跳轉去其他話題,當用戶的意圖跳出話題時,使用百科知識和兜底話術應對,再通過話輪樞紐將重新引導回話題,盡量完成一個完整的對話流程。

這種閒聊模式,我們稱之為 “對話情感體驗地圖” 。

我們之所以將詩歌作為閒聊主題,是因為技術團隊現有一個較具規模的詩歌知識庫。但用戶主動去獲取詩歌知識的場景並不多見,那麼這些能力很大程度上是被 “閒置” 了。

如何充分利用計算機現有技術能力和信息儲備,將其轉化為活的服務,主動觸達用戶,這是設計師需要思考的。在人工智能尚未達到 “全知全能” 的現階段,如何充分利用當前的已有資源,完成計算機能力向用戶需求的轉化,我認為這是設計的核心意義所在。

04 語音交互需要怎樣的體驗設計師?

語音交互的特殊性為體驗設計師提出了新的要求和挑戰。人類的語言能力是天生的,用戶的語言行為模式不會因為交互對像是計算機而發生改變。

傳統的交互方式要求用戶學習計算機的規則,而在語音交互中,計算機必須完全順應用戶的邏輯。因此,設計師首先要理解“語言”的本質,理解用戶的“語言邏輯”,才有可能設計出流暢自然的語音交互體驗。

其次,設計師還必須理解技術的實現機制,才能和技術配合,將技術能力最大化,並和技術攜手不斷拓寬彼此的邊界。

寫在最後的一點感想: 以上就是我作為語音交互領域中的一個 “異類” 設計師,在項目過程中的一些經驗之談。

人工智能、機械智能是一個長期發展的過程。在 “強人工智能” — 機器自主學習和進化的階段到來之前,“人工” 的​​因素仍然十分重要。通過模擬人類行為,為計算機搭建“世界觀”,為機器學習積累有效數據,不斷提高人工智能發展的起跑線,是一個必然且長期的階段。

所謂 “妙語匠心”,人工智能在語音交互中所展現出的每一分 “妙語”,不僅僅是強大技術能力的支撐,實際上也蘊含著設計師十分甚至一百分的“匠心”。

同時,在設計上,我們也在不斷探索設計和技術的結合方式,在對話內容和對話劇本的自動生成、人格化語言體系的構建等方面,我們已經開始了一些探索。

語音交互行業才剛剛嶄露頭角,我們在設計上還有很長的路要探索,設計和科技需要攜手不斷拓展邊界,我們共同的目標都是提供給用戶更好的服務、帶給用戶更好的體驗。不管技術如何發展,時代如何變遷,不變的是對人和人的需求的關注,UXD 時刻關注用戶視角、價值導向。

同時,感謝團隊中與我通力合作的小伙伴們,體驗設計師的視角和語言學者的視角碰撞出了很多火花,給了我不少設計靈感和有益的幫助,讓我在短短不到一年的工作中,沉澱出了這些心得。同時,我也十分希望能給同行業的設計師們一些不同視角的參考,期待語音交互這個新興的行業因為我們的探索而更加蓬勃地發展。

阿里花名:婉語

畢業於新加坡國立大學,之前的標籤是#語言學#女博士,現在還多了#語音交互#體驗設計師。

和 “語言” 結緣8年時間,仍然保持著新鮮感與好奇心。之前我研究語言的歷史演變與地域變異,語言和人類認知的關係,現在我更多思考語言和技術的結合,語言和用戶的需求。

隨著 2018 年的結束,智能語音設計除了在 Chatbot 產品上有大幅成長外,也陸續在其他智能硬件類型的產品,有許多的突破。也因此在業界開始有比較系統化的、專業化的沉澱,只能說在 CUI Designer 這條路上,環境也正在慢慢的越好囉!

如果對於本篇的文章有其他建議,也歡迎底下留言討論喔~

謝謝大家看完,如果你喜歡這篇文章的話,也請記得點贊一下喔!如果覺得寫道你的心坎裡,也請不要吝嗇用力點個 5 次贊!我們下次見囉 See ya~

-Nathan

--

--

NathanChen
UXeastmeetswest

Staff Product Design @Dingtlak.inc Alibaba Cloud., believe in design is communication, to User, to Product, to Company.