Go ahead, ask him anything!!
IBM全球副總裁/Watson首席技術長Robert High 在一篇訪問報導中指出,經過迅速的發展,目前的AI已能夠真正了解人類說話的邏輯,並模仿人類如何將單字組合,變成一個能達意溝通的「語意模式Pattern of meaning」。而由文字單詞所組合的「知識」在解構分析後,能夠在數位世界再組合拼接,進行對話,包括之前的數位傳遞分享,無論是「文字到語音Text-to-Speech(TTS)」或「語音到文字Speech-to-Text(STT)」的數位形式。

Robert High還說,「AI」應該稱之為Augmented Intelligence(擴增智慧),而非Artificial Intelligence (人工智慧)。目前的AI技術具備基本的認知技術(Foundational cognitive skills)能辯詞識字懂話,但作為數位服務個人需求的擴增智慧之知識補充,AI技術也能進行更高階的預推論技術 (Prior reasoning skills),在對話中進行基對話回覆/諮詢預判,以及相對應的歸納過程,理出未被發掘的相關資訊。
而在文中,他所提出最重要的AI技術發展觀察則是:AI從研發走到商用/日用,關鍵在於:「AI能夠真正理解人類的語言!」而這已不是他主導Watson AI語音技術與應用的預期目標,因為IBM Watson技術早已於2017年6月在巴西聖保羅州立Pinacoteca博物館(Pinacoteca do Estado de Sao Paulo) 推出數位AI導覽服務~「The Voice of Art / with WASTON」 。IBM研發團隊為了培養WATSON的應答能力,共花了6個月時間與西聖保羅州立博物館策展人和研究員合作,以大量的書籍、報導、傳記、訪談、網路資料、影片讓WATSON透過機器學習累積對於藝術作品豐富知識與答案,並擴大可對話與提供回覆的範疇,果然讓「The Voice of Art / with WASTON」與使用者有更自然的對話,這也成為在博物館相關智慧語音科技導入相當著名的案例。

而在ADWEEK.com一篇關於IBM Watson智慧導覽語音服務的報導中:「IBM Watson’s New Job as Art Museum Guide Could Hint at Lots of Future Roles With Brands」,就有個副標題:
Go ahead, ask him anything!!
這是相當貼近的應用實況,也是本文標題~【從keyword-ese到natural Language的人機溝通】構想的來源。我們在網路上進行資料或知識搜尋,都還是習慣以關鍵字為主,而不/ 無法使用完整句子。但我們都知道對話、問答都需要完整句子、上下文脈絡,斷非以關鍵字就進行的,所以人機間的溝通並非正常的或接近於對話的形式。
自然的人機對話
「keyword-ese」一詞指的就是「以關鍵字為主,而非完整句子的搜尋方式 」。使用者均已習於如此操作,即使 Google的搜尋引擎漸棄「關鍵詞」且逐步地導向更完整、符合脈絡的「自然語言」搜尋技術,畢竟這樣的「AI」服務也比較符合Robert High所說的「AI (Augmented Intelligence 擴增智慧)」。而且根據一份報導,Google Search的副總裁Pandu Nayak才剛剛於最近(2019.10.25)宣布Google將導入AI系統~BERT (Bidirectional Encoder Representations from Transformers /以Transformers為主要系統框架的雙向編碼表徵),BERT就是透過演算法去理解使用者所輸入之問題的,Transformers模式主要用以分析字詞在整個句子脈絡中的關係,白話就是聽懂你說的話、問的問題。
Nayak舉例說:像是在Google搜尋欄中提問「do estheticians stand a lot at work?(美容師在工作時需要常站著?) 」。如果是在未導入BERT之前,會將「stand 站著」這個詞單獨抽出,並且據以搜尋匹配「stand」此單詞的網頁;但在使用BERT的AI 運算後,Google搜尋會根據提問,了解「stand」在此句是要問的還包括「美容師工作的體力要求」。
該報導中,也特別介紹了Google在搜尋服務方面的關鍵技術變化:
- 2009年,Google證實了它不再以「關鍵字」作為排名因素,有可能是因為一些負面因素。
- 2012年,Google發表「知識圖譜knowledge graph」技術,此技術會利用收集自不同來源但彼此關聯的信息去增強搜索結果。
- 2013年,Google宣布推出Hummingbird,可透過演算去理解單詞的含義,而非僅是進行單詞匹配查詢。
如今,2019年Google Search更將導入AI系統~BERT,透過完整提問就能找到更精確的資料。於是人機溝通已從keyword-ese進展到natural Language。對個人來說,對此技術關注的重點在於如何跟具有龐大資料庫的機器人、智慧語音、搜尋引擎對話。就像下圖所示的「Google智慧語音技術解決方案」,人可以跟雲端資料庫對話獲得必要的服務,不管是深度知識資料或者是日常生活資訊。
其實Google更早在它的Google Books數位服務就使用過natural Language搜尋~【Talk to Books】(如下圖)。【Talk to Books】這款Google AI 實驗應用是透過自然語言處理技術(natural language process)讓使用者以「完整句子」而非「關鍵詞」去搜尋100,000本電子書的內容。且就像其網站上所說的:「用句子跟他說話將能獲得比關鍵字更好的搜尋結果。這是因為AI以對話形式訓練的。」

所以,我問「What is the value of Virtual Reality to a cultural experience?」
而如此以AI智引書籍回覆後。我的問題共找到20則書中的引句,基本資料也包括書名、作者、圖書資訊等,且可以進一步閱讀與了解。雖不都是全部能夠針對 “the value of virtual reality for a cultural experience?” 提供適當回覆的,但所提供的回覆結果排序確實能看得出其間的相關性的排列。

若進一步根據搜尋結果,去整理VR的應用價值的話,下面所引的各家觀點也能夠針對VR的虛擬化視覺內容應用與效果,以及沈浸式視覺的感官、心理體驗等形成摘要或總結的論述,在其中Tom Boellstorff, Bonnie Nardi, et. al.(2012)所提出:「我們正處於一個虛擬世界的人類學研究成果相對較少的歷史時刻。」就很有力道與價值。前述引文簡列如下:
The use of Virtual Reality (VR) in cultural heritage has a fundamental objective: to approach the history of the peoples, through their heritage, in a simple way so that their understanding and learning is easier and more attractive for the public.
在文化遺產中使用虛擬實境(VR)有一個基本目標:通過文化遺產,以簡單的方式了解人民的歷史,使相關的理解和學習更容易且更有趣。
by Marinos Ioannides, Eleanor Fink, et. al.(2018). Heritage: Documentation, Preservation, and Protection: 7th International Conference, EuroMed 2018, Nicosia, Cyprus, October 29–November 3, 2018, Proceedings, Part 1Virtual Reality, apart from having different uses regarding medical science, education or entertainment, is being increasingly used for the dissemination of cultural heritage.
虛擬實境除了在醫學、教育或娛樂方面等不同用途外,也在文化遺產的宣傳應用上越來越多。
by Carlos L. Marcos (2018). Graphic Imprints: The Influence of Representation and Ideation Tools in ArchitectureBased on positive experiences such as those presented above, it can be stated that virtual reality creates an immersive and attractive experience in terms of presenting a virtual museum that is a good alternative to publicize the cultural heritage to the general public or a particular group of users.
基於如上述的正面經驗,可以說虛擬實境在展示虛擬博物館方面創造了具有吸引力的身歷其境體驗,虛擬博物館是向大眾或特定用戶群宣傳文化遺產的良好替代方案。
by Rafael Aguilar, Daniel Torrealva, et. al.(2018). Structural Analysis of Historical Constructions: An Interdisciplinary ApproachThe Virtual Reality system will have higher or lower immersion degree depending on the interface used (screens, projectors, VR glasses …) and it will increase according to the user interactivity with such environment.
虛擬現實系統具有高低不等的沉浸程度,此取決於所使用的媒介(螢幕,投影機,VR眼鏡……),並且會根據使用者與虛擬環境的互動有正相關。
by Carlos L. Marcos(2018).Graphic Imprints: The Influence of Representation and Ideation Tools in ArchitectureThese virtual environments occupy a little space (65” screens mounted vertically, or as table computers) and complement the limitations of space in museums, but the value that they are able to add to the learning, teaching, research, and access of heritage is significant.
這些「虛擬場景」只佔據一點空間(垂直安裝的65吋螢幕,或作為桌上型電腦),並補充了博物館的空間限制,然而它們能為學習、教學、研究、進入遺產所創造的價值是很明顯的。
by Aaron Marcus (2015). Design, User Experience, and Usability: Users and Interactions: 4th International Conference, DUXU 2015, Held as Part of HCI International 2015, Los Angeles, CA, USA, August 2–7, 2015, Proceedings, Part 2There is a theory that the dimensionality and the virtual reality benefit the “immersion” perceptual and emotional well-being of those who use it.
有一種理論認為,維度空間感和虛擬實境有益於使用它的人之「沉浸式」知覺和感覺的健康。
by Tom Boellstorff(2015). Coming of Age in Second Life: An Anthropologist Explores the Virtually HumanThis would lead to a unique type of virtual reality environment in which the environment becomes the brain, and the client experiences the inner world as a vivid representation in the outer world.
這將形成一種獨特的虛擬實境,在其中的(沈浸)環境會使大腦、感官都體驗到宛如外部世界一樣生動的內部世界。
by David S. Cantor, James R. Evans(2013). Clinical Neurotherapy: Application of Techniques for TreatmentImmersion creates the sense of being present in a virtual world, a sense that goes beyond physical input and output.
沉浸感創造了在虛擬世界中存在的感覺,這種感覺超越了物理性的內外感知/感覺。
by Michael Heim(2000). Virtual RealismManipulation of objects is one of the most fundamental tasks in everyday life.To further enhance the immersion of the user in virtual reality, objects and their virtual representation where added, making the experience more authentic.
操縱物體是很基本的日常活動之一。為了進一步強化使用者在虛擬實境的沈浸感,可透過物體在虛擬環境的呈現而使體驗更加真實。
by Michael E. Auer, Danilo G. Zutin (2017). Online Engineering & Internet of Things: Proceedings of the 14th International Conference on Remote Engineering and Virtual Instrumentation REV 2017, held 15–17 March 2017, Columbia University, New York, USAWe are in a historical moment in which the body of published research employing ethnographic methods for the study of virtual worlds is relatively small.
我們正處於一個虛擬世界的人類學研究成果相對較少的歷史時刻。
by Tom Boellstorff, Bonnie Nardi, et. al.(2012). Ethnography and Virtual Worlds: A Handbook of Method
相信各位都使用過Apple的Siri、Google的Google assistant、Amazon的Alexa、或者是微軟Cortana,這些都是語音助理(Voice Assistant)、虛擬助理(Virtual Assistant)、人工智慧助理(AI Assistant、AI-Powered Virtual Assistant)的實際運用,並已廣泛用在「智慧音箱」、「AI bot機器人」上,展現互動語音研發技術與成果的飛速進展。所以,若對於相關科技的發展有所了解的話,看到Google Search的【AI BERT】與Google Books的【Talk to Books】的實際運用,也僅會覺得是水到渠成的智慧語音科技成果。
之前因為霍金博士過世,寫了篇人機語音的專文在泛科學網站刊登~【剖析霍金的「代言人」:人機如何透過語音互動溝通?】。文中特別提到霍金博士那著名美國口音「代言人」,霍金博士在「DECtalk」這家科技公司要幫他進行語音合成軟體升級時,仍要求DECtalk一定要使用 Dennis Klatt所錄製的原聲音檔。後來換Intel 為他建置新的軟體時,他也堅持要用 Dennis Klatt 的聲音。
就像霍金博士的語音合成的原音是 Dennis Klatt的美國口音。大家也能用的iOS Siri 在發音上則更接近自然人聲,那聲音是用 Susan Bennet 的聲音組合的(見下圖),而男聲版本的,可以查到資料的是幫英國 Siri 版配音的 Jon Briggs,他算是 iPhone 4 第一代 Siri 的男聲。

而且無論是把目前坊間所用的 Alexa、 Siri、Cortana 稱之為語音助理(Voice Assistant)、虛擬助理(Virtual Assistant)、人工智慧助理(AI Assistant、AI-Powered Virtual Assistant),而且就像「The Surprising Repercussion of Making AI Assistants Sound Human」以及「Why Do So Many Digital Assistants Have Feminine Names」這兩篇談到的:為何AI助理得聽起來像人?語音智慧系統都採女性名稱?數位語音助理的Humanlike這種(擬人化 anthropomorphic)傾向,以及命名女性化的特徵,在在顯示數位助理的研發是在追求一個全知的AI語音助理,或許在具體樣貌上,就會像是鋼鐵人的人工智慧助理:J.A.V.I.S. (Just Another Rather Very Intelligent System的縮寫) 一樣。
之前在個人2019.5.20發表的【博物館科技系列:就這樣「達利」了嗎?「達利」就這樣嗎?】中就介紹過美國佛羅里達州的「達利博物館(Salvador Dalí Museum)」特展推出的互動多媒體裝置。已於1989年逝世的達利再透過「DeepFakes」(AI換臉影像科技)帶著優雅身形,且利用人工智慧、機器學習科技讓「達利」操著獨特口音栩栩如生地在螢幕上與訪客互動,這位「重返人間」的超現實藝術家不僅會介紹自己的藝術、創作、與生平,還會邀請拍照、讀報分享頭條新聞,需要的話,他也可以像智慧語音助理一樣提供天氣預報。以下統稱這個 AI互動多媒體展品為:【Dalí Lives】。
上面談到的議題所呈現的我們對人工智慧科技服務的具體想像與實際經驗,其實目前數位科技所致力的不是機器人助理,而是更接近「人」的虛擬助理。無論是在語音對答服務時更像真人的語調,或者是在命名與性別上。有次在北教大「博物館管理與科技應用在職碩士學分班」的課程中,學生就在這議題討論時,談到「恐怖谷理論」。所以下面就引一張個人在專文【數位科技系列:談「恐怖谷理論」~看研究面向與資訊視覺設計的多元性】就用過的附圖談「恐怖谷」,但也特別把目前最常見的智慧語音產品~數位音箱加入分佈圖。
「恐怖谷理論」是由森政宏在1970年針對機器人的「好感度」與「逼真性」分析所提出的,森政弘認為由於擬人似人的機器人或人形器物能獲得人類的正面情感,但隨著其外形、動作、表情越真仿難辨,越與人類近似時,人們會因畏懼而益發反感,使好感度急墜,宛如陡降至深谷底。
從下圖去看目前坊間所建的各式智慧語音對話服務產品與應用(包括智慧機器人),會發現確實頗符合大家對於這類數位科技產品的「熟悉度」、「好感度」的情感區間分佈。

而個人其實不是機器人的愛好者,甚至寫過【博物館科技系列:博物館&Pepper?!嗯…可以不要嗎?】,因為當時在2018年4月27日,ICOM MPR(國際博物館協會 行銷與公關委員會 )粉絲社群,有個留言:Are we facing the new era of museum communication?其中分享了一則 ArtNet News上的報導~「The Robots Are Coming (for Your Docents): Meet Pepper, the Smithsonian’s New Automated Tour Guide 機器人導覽員來了:史密森尼博物館的自動化導覽~Pepper」。目前史密森尼博物館嘗試了「Pepper導覽員 Pepper Docent」,我們說個數字,史密森尼博物館有5位「Pepper Docent」,在5個館舍。
我個人認為,依目前所看到的報導與分析,其實都特別提出其推廣的困境,且分析報導還提出不少軟硬體「缺陷」,甚至特別點出:有媒體毫不留情地寫出「它纖細無力的手指,甚至都沒法給主人倒一杯茶」的評語。而且各家廠商在市場紛紛推出類似人工智慧機器人,甚至是像目前最熱門與普及,由Amazon、Google 、 Apple在此服務廝殺激烈的「全能語音助理」產品與服務,Pepper似乎已漸漸失去其吸引力。而且在台灣推廣與租賃Pepper的沛博科技,在2017.4「Pepper 機器人為何陷入了困境?」這篇報導時,約出租180台,目標是全台180台。看來尚難期待行進速度3 km/hr,也就是50 m/min,無力持杯的Pepper能普及到提供吸睛以外的服務。可想像,未來在史密森尼博物館偌大的館舍,要方便得到「Pepper Docent」並不容易(目前也無此必要性),要讓約每秒移動1公尺的「Pepper Docent」陪著移動導覽,應該也很蘇活。要像真人導覽員一樣排時段嗎?個人會選擇真人導覽行程。
況且如果所謂的博物館智慧語音導覽的問題是:「導覽員會說話」比較好?還是「博物館會說話」比較好呢?個人是認為:這不是偏廢問題,而且兼有之時的選擇問題。
個人絕對支持「博物館會說話」。
智慧語音的本體論
「本體論Ontology」是援引自哲學的研究領域,但廣泛被應用於人工智慧(Artificial Intelligence)與知識工程(Knowledge Engineering)等領域知識(Domain Knowledge)上,且用以「描述知識領域」與「建立知識的描述模式」,甚至是具有可以明確描述語意與關係的電腦語言表達能力。因此簡單說,本體論是用來描述知識的語言。當需要表達與檢索時,特別是在數位化應用上(例如:Chatbot、智慧音箱),本體論知識庫(Ontology-based Database)就是必須,因為其具有能清楚描述語意與關係的電腦語言式結構化表達能力。
前面有提到:
「….於是人機溝通已從keyword-ese進展到natural Language。對個人來說,對此技術關注的重點在於如何跟具有龐大資料庫的機器人、智慧語音、搜尋引擎對話。就像下圖所示的『Google智慧語音技術解決方案』,人可以跟雲端資料庫對話獲得必要的服務,不管是深度知識資料或者是日常生活資訊。」
既然「AI機器人寫/說文物說明」已成可能,而且會是未來重要的智慧導覽內容,目前看來,技術關鍵看來應該是「本體論知識庫(Ontology-based Database)」的建構。所以,確實該正視這趨勢。無論各位是信或不信,可以參考【不只會寫財報,Google贊助媒體2千萬開發會寫地方新聞的AI記者】這篇科技新訊,報導中說只要在Google News搜尋「這則新聞由Automated Insights產生(This story was generated by Automated Insights)」,就會出現美聯社由機器人產生的新聞。所以說,AI也已有很多文稿/報導編寫的實際應用。

「Context語境」、「Language語言」、「Reasoning推理」被視為人工智慧的三大挑戰,但如果是要考慮的AI數位語音助理之研發應用的話,它們也是機器學習、自然語言處理兩項技術的重大挑戰。現如今,特別是金融是一個全面採用自動化技術的行業,也就是大家熟悉的FinTech趨勢。針對「數據資料導向任務(Data-Driven Task)」的自動化來說,AI技術已被充分運用了,AI財經機器人已能自動撰寫處理「基金財務報告 Fund Reporting」、「損益分析報告Profit & Loss Reports」、「信用管理報告Credit Management Reporting」、「銷售報告Sales Reporting」(資料來源)。看來,許多挑戰已隨著應用需求與科技發展,而逐漸被克服。
而我的重點是,人工智慧技術、機器學習模型已經能夠自動判斷文本的結構和含義,像是根據霍金博士輸入的幾個字,自動判斷後提供「選用字句(Candidate Sentence)」,有效減少輸入次數;或者說像前面例舉的「Grilled Murder Mystery」智慧語音應用。
所以,會很期待在TTS、STT、AI、Machine Learning、NLP等技術的持續發展,以及典藏資料庫的內容支援之下,有機會在博物館、商展、展演機構見到「全知型」互動對話導覽服務的出現。
下圖是使用自然語言處理(NLP)技術,利用分析器(Parser)將一段「畫作說明文字」(梵谷自畫像)進行語法分析(Syntactic analysis)的結果。這段「畫作說明文字」在數位處理分析後,由分析器解構成各個詞彙單位,並呈現其結構和含義。語法分析也用來建立樹狀的語法樹(syntax tree),透過中間表述提供詞彙單位串流的語法結構。
該段說明文字如下:
「Vincent van Gogh painted his first known self-portrait in 1886, following the model of the 17th-century Dutch artist Rembrandt. But by the time he made this work, a year later, he had clearly shifted his allegiance from the Old Masters to the Parisian avant-garde. Under the influence of Neo-Impressionist color theory, he based this painting on the contrast of complementary colors.」
Syntax分析結果見下圖:
台灣有沒有機會將這樣的智慧語音技術使用到「博物館數位典藏資料庫」,且透過數位加值應用去運用在AI導覽或相關數位應用上呢?當然這是得努力的,也要有完整計畫。(記得有次去國圖開會,也提供了Talk to Books的範例示範與應用,建議他們可以使用這樣的數位技術,去增益圖書搜尋的準確度與延伸,且減少搜尋上的知識與資訊門檻,但….. 。圖書館需要的不是像克里夫蘭美術館那種互動資訊牆啊!又不是美術館,那種錢都可以用來建置智慧語音搜尋了。又是個唉!)
但至少【博物館社群後設資料發展與數位典藏應用之分析】這篇報告在文後的結論與建議是這樣說的:
- 發展發展台灣地區 CDWA (藝術品描述類目)標準應用檔
- 推廣與應用「資料內容」標準:以 CCO (Cataloguing Cultural Objects)為基礎
- 發展與整合博物館社群知識組織系統:包括權威檔、索引典及領域知識本體 (Domain Ontology)
- 建立博物館 Metadata 標準互通機制:包括對照表系統(Cross-Walking Repository)以藝術品描述類目(CDWA)
各位有沒有在文中看到「領域知識本體」一詞呢?
所以數位典藏計畫所建構的「領域知識本體 Domain Ontology」資料庫,確實可以作為分析的基礎,透過數位技術以自然產生語意變成組織性的資訊。現在台灣也已有AI語音互動的先驅廠商能夠透過「領域知識庫資料」中文句分析,萃取出分類的關鍵字詞與文字向量,而提供語音服務應用了。
個人也期待可以看到,有台灣的數位語音智慧科技團隊針對數位典藏計畫所建構的「領域知識本體 Domain Ontology」資料庫作為分析基礎,導入「自然產生語意變成組織性資訊」的數位服務應用,讓相關人工智慧科技的研發針對博物館各種業務提供輸入分析與輸出製作的尖端應用。因為,如果「本體論Ontology」能夠有系統地被建構,包括:詞彙體系、語意結構、術語關係、非類架構、結構化規則、概念化描述、形式化說明等。以資訊為源、文字/語音為體的「領域知識」,確實可以期待能以「Chatbot」 為形用,運用Story Telling/Narrative提供知識分享與查詢的數位技術應用。
就像前面舉「梵谷自畫像」的說明文字分析為例。使用自然語言處理(NLP)技術,利用分析器(Parser)將(梵谷自畫像)「畫作說明文字」進行語法分析(Syntactic analysis)。或許,台灣博物館/美術館基本文物說明(也就是導覽文本),也就是制式的文物說明後設資料,可以由AI撰寫,然後再推廣應用、研究分析,再據以加入類似#hashtag的標籤,擴大數位參與使文物故事story可以變成不同適性版本的stories。
以前也撰寫過陶瓷文物的「語音導覽器錄音稿」,基本格式就是:「品名(朝代+窯址+品類+裝飾+器類)」、「藝術史定位與重要性」、「整體工藝特色」、「該器工藝特徵」、「器類品鑑重點」、「特色強調」等內容格式。基本上,寫過的就知道,不僅是要有metadata的基本架構,在描述上也必須有其架構。若採用Ontology分析技術,這格式就會類似可以透過自然產生的語意,提供組織性的對話的「 智慧語音服務內容」。
像是以下這樣:
北宋 耀州窯 青瓷劃花牡丹碗耀州窯的窯址是以今天的陝西省銅川縣黃堡鎮為中心,因為這裡在古代屬於耀州,所以稱為「耀州窯」。耀州窯以燒製青瓷為主,釉料的特色為青色當中閃露著黃色,器皿的種類則以碗最有特色。這件帶有橄欖綠色調、外表溫潤中透顯著瑩亮光澤的青釉碗,表現出耀州窯獨具的風格特色。裝飾紋樣方面,耀州窯的匠師擅長以刻劃花和印花技法,這件作品的內部,就是採用刻劃花技法。匠師以斜刀紋深深地刻劃出牡丹的輪廓,再以有一道排齒的竹刀補劃一些細緻的紋路,這些刀痕傾斜的地方在上釉之後會累積釉料,形成比較深的色澤,就像是陰影,使花、葉更為立體生動。而層層上揚的牡丹花瓣,則展現出飽滿盛開的豐滿姿態,而在枝葉的烘托之下,更顯現出牡丹的富麗嬌貴。整體的裝飾空間佈置貼切妥當,有一種幽雅、和諧的美感。小結:
在個人專文【數位轉譯/數位科技系列:Virtual Immersion or Mixed Reality】中所引的一些專書,是透過【Talk to Books】查詢到的,其中有段話,很適合引用到本文去建立作為創新/嶄新應用的「數位科技」的「Novelty/Familiarity 新奇/熟悉」觀念,因為「新事物只是在舊經驗中尚未被熟悉,能透過舊經驗去理解熟悉」。
Novelty versus familiarity. New objects in a familiar setting or familiar objects in a new setting tend to be picked out quickly
「新奇」就是在熟悉設定中的新事物;「熟悉」就是在全新設定中很快被挑出來的已知事物。
from Leading Through Leaders: Driving Strategy, Execution and Change
by Jeremy Tozer
Kogan Page, 2012
【數位轉譯/數位科技系列:Virtual Immersion or Mixed Reality】特別介紹了Amazon的【Echo Frames】(搭配語音助理Alexa的智慧眼鏡)與 【Echo Buds】(搭配語音助理Alexa的無線耳機)。對於已有成熟Alexa語音技術與周邊產品的Amazon再據此基礎推出的穿戴式裝置,並且Alexa智慧語音服務的使用場域,從定置式裝置提供的室內空間數位智慧化,變成「可攜式portable」、「行動化mobile」、「可穿戴wearable」、「隨時隨地 ubiquitous」、「輕量化 lightweight」的個人型智慧語音服務。Echo Frames 的外觀確實就像款普通黑框眼鏡,重量僅有 31 克,並沒有任何螢幕或者攝影鏡頭,只有麥克風以及小型喇叭,自然就沒有AR 或其他酷炫功能,但隨時召喚出 Alexa,去播放音樂、安排行程、獲知天氣新聞、語音通話,甚至去操控智慧家居設備等Echo&Alexa系列產品之前所做的,此次發表的新品也都有。而在發表會上或宣傳影片中,也都在在強調【Echo Frames】與【Echo Buds】仍讓你與周邊人事物(the world around you)有所連結,麥克風與喇叭都是配合使用者的指向性設計,就像宣傳片中說的「echo frames direct sounds straight to your ears so you can discreetly hear Alexa.」。


所以看了Amazon的搭配語音助理Alexa的周邊產品,不禁令人想起在丹布朗《起源 Origin》一書中AI 智慧語音助理~溫斯頓。溫斯頓操著優雅的英國口音透過耳機為蘭登博士導覽,並會在蘭登於博物館隨意欣賞展覽時,還特別提醒他在現在位置之正前方的地板上有幅伊夫·克萊因的作品【游泳池】,並介紹其中的藍色更被稱作「國際克萊因藍」。
未來若能實現,就可以想像類似於【Echo Frames】與【Echo Buds】能透過智慧語音技術為各種參觀活動提供多棒的即時導覽!
所以,「 從keyword-ese到natural Language的人機溝通」已在發生中!!!

參考資料:
陳亞寧. (2005). 後設資料發展趨勢與數位典藏應用之比較研究. 圖書與資訊學刊, (53), 31–50.
何維涓. (2017.11.18). 理解人類語言成為AI突破關鍵,下一步是小數據人工智慧. 2019.11.03. 擷取自:https://www.ithome.com.tw/people/118225?fbclid=IwAR0h-P1mxllCkrVa2s7D4GomSYtHM-axmy92Sd03hibfhkwtgQOjAINK45U
施登騰. (2018.3.28). 剖析霍金的「代言人」:人機如何透過語音互動溝通?. 2019.11.04. 擷取自:泛科學 https://pansci.asia/archives/170989
Angela Natividad. (2017.4.19). IBM Watson’s New Job as Art Museum Guide Could Hint at Lots of Future Roles With Brands. 2019.11.03. retrieved from:https://www.adweek.com/creativity/ibm-watsons-new-job-as-art-museum-guide-could-hint-at-lots-of-future-roles-with-brands/
Liz Stinson. (2017.12.5). Why Do So Many Digital Assistants Have Feminine Names?. 2019.11.04. retrieved from:https://www.theatlantic.com/technology/archive/2016/03/why-do-so-many-digital-assistants-have-feminine-names/475884/?fbclid=IwAR1B5IdPB3TouDvUPflW94ToYw5PspZ31zD_uVDK3_OZxfj4JsPzyjJFZfI
Adrienne Lafrance. (2016.3.30). The Surprising Repercussions of Making AI Assistants Sound Humans. 2019.11.04. retrieved from:https://www.wired.com/2017/05/surprising-repercussions-making-ai-assistants-sound-human/
The Botify Teamm. (2019.10.25). The Google BERT Update: What It Means for Search Intent & Keyword Tracking. 2019.11.03. retrieved from:https://www.botify.com/blog/google-bert-update-keywords-intent

