做AI的主人! AI 公司會怎麼做?與機器學習團隊成員對談心得

阿好 DamnGood
程式猿吃香蕉
Published in
Jun 9, 2023

作者阿好本業資料科學家,業餘就用文字說說有趣故事。紀錄身邊奇人軼事,《程式猿吃香蕉🍌》客座專欄作家

生成 AI 掀起的滔天巨浪,不知道各位讀者怎麼接招?

不管你覺得「AI 好像會思考,不知道什麼時候會取代人類的工作…」抑或是「AI 還是很遙遠吧?我的工作專業得很哩,不容易被取代啦!」

從這篇文章開始,將有不同領域的專業工作者提供各自的看法和實作經驗,或許你也可以從中得到一些啟發。其他產業也許還可以繼續吃飯睡覺打東東,但是首當其衝的 AI 相關產業,他們可不能蒙上眼睛就以為看不見,必須要考慮如何站在巨人的肩膀上,看得更遠,做出更在地化的產品,才能夠在這瞬息萬變的巨大潮流中站上浪頭取得領先!

所以,本篇訪談心得,就先來分享某業界領先的 AI 公司的機器學習科學家團隊成員,在ChatGPT 竄紅以來,這短短幾個月中,所做出的各種嘗試。

▍受訪者背景介紹

  • 角色:機器學習科學家團隊
  • 工作內容:利用機器學習模型,協助用戶精準行銷

以下將以 Q & A 對話形式紀錄訪談內容。訪談對象發言簡稱為「Alex」。

如何看待 AI 生成技術?

Alex 表示,AI 仍屬於小幫手角色,他們開發主要分幾個方向:

  1. 用戶可使用自然語言 (Natural Language Processing,縮寫 NLP ) 操作的小工具,eg. 文案生成器。
  2. 自動化取代耗費大量人力時間的初階工作,eg. 生成廣告文案圖。
  3. 資料分析。

其中資料分析的部分,簡而言之,就是強化商業智慧 (Business Inteligience),現在相關工具已經發展地很成熟,但是!還是要耗費許多人工和溝通成本。

痛點就是溝通成本相當高,因為發出需求的行銷/營運/高階主管,可能無法清楚地跟工程師表達想法。一來一往的溝通過程中,通常又會多了很多的願望,或是臨時有什麼新想法等等。這次的新嘗試,Alex 從商業智慧應用中最常見的以下三項來做:

資料分析大對決:AI 生成 vs. 專家

我從事資料科學工作多年,非常樂見 Alex 團隊讓用戶用自然語言 NLP 跟系統對話,在過去,需求單位必須要花很多心力翻譯使用者的需求,再轉換成資料工程語言,如果可以讓 AI 產生初步結果 (同上述表格中「異常偵測」和「資料洞見」),需求單位就不必靠著工程師也能悠遊在資料大海之中,解決日常營運問題,意味著資料團隊就可以花上更多時間尋找資料中的鑽石!

有意義的資料分析向來不是件容易的事情,尤其是透過不同觀點可以找到問題癥結,通常是做完前面的基礎建設,就花掉大半力氣了,如果可以透過 AI幫手達成初步分析,資料分析師就可以集中火力在產生更重要的價值上了吧!

AI 也會有好奇心嗎?

我們可以讓 AI 自己挖掘問題 ,發現五倍鑽石嗎?

Alex 表示,我們總有這種期待:

只要資料科學團隊掌握了大量的數據,就自然可以發現新觀點。但其實非常這是相當不容易的。

雖然說可以試著 Think outside of the box,也就是跳出框架,講些天馬行空的點子,畢竟只要沒提過的都是「新」的嘛!但是如果沒辦法付諸實行,這些點子都只是妄想而已。要創新又要必須切合使用情境,真的是大哉問?那麼,要如何產生新觀點?Alex 團隊用了「讓 AI 自己問自己」的流程。

我內心 OS : 難道不會變成下面的狀況嗎?

A問B:怎麼辦?

B回A:你說怎麼就怎辦?

無限循環問答下去,誰知道要在哪裡喊停?怎樣才知道是有價值的答案?這問題恐怕沒有答案。但不得不說,「自己問自己」的確是蠻有新意的玩法啊!(AutoGPT 也是用了同樣的觀念)

資料中的五倍鑽石是什麼?

Alex 表示,以專家的角度來看,最珍貴的五倍鑽石並不是「新觀點」,好奇心才是一切的關鍵。對資料有好奇心,帶著疑惑繼續打破沙鍋問到底,才會更深入挖掘資料的方方面面。

對資料充滿好奇心,會是什麼樣的具體產出呢?

在這裏,我和 Alex 談到了電子商務做搜尋相關的報表經驗:Abandoned Query 被放棄的搜尋關鍵字。

Abandoned Query 顧名思義就是用戶搜尋了卻沒有點擊結果。用意在於知道哪些關鍵字搜尋量很高,卻有很高比例的沒有點擊搜尋結果。

這份報表將會由專案經理定期瀏覽,藉以改善搜尋品質。其實大部分多數工程師就會按照基本程序,確定資料源 →釐清資料定義 → 驗證 → 結案!

但是腦袋常常亂轉的我,忍不住會多想:喔?為什麼這些搜尋字會被放棄啊?是什麼原因?可以自動分類歸因嗎?比方說:

當紅的韓國明星名字居然是Top 10被放棄的搜尋?Why ?

  • Ans:因為這是翻譯名詞,用戶常使用各種譯名,但是我們並未將這些譯名建立同義詞字典檔,導致無法出現搜尋結果。
  • Insight: 這個翻譯名稱的問題,在許多常見的國外品牌都能處理地很好,例如拼寫錯誤或者有沒有空格這些,經過設定同義詞,用戶都能搜尋出正確的商品,但是當紅的韓國明星突然走紅,我們的系統管理者來不及有所對應,經過再次審視這個結論,我們很快的發現了問題,並請相關單位採取行動改善了搜尋結果。

大廠牌牛仔褲居然居然是 Top 10 被放棄的搜尋?Why ?

  • Ans:用戶原本期待購物平台應該包含大廠牌,結果就是真的沒有賣!
  • Insight : 意外搜出用戶的期待,可作為日後合作廠商的參考。

我當時只是憑藉著好奇心,追根究底,想要找出原因,就順手歸納各種被放棄原因,意外地這些原因 (root cause) 成了搜尋引擎的健康檢查指標之一。

▍訪後心得:人類的好奇心

和 Alex 對談過程中,我們不斷地談到一個有趣的主題:人類的好奇心

人類好奇心的規則是什麼呢?我覺得啊,好奇心才是可以發掘出一顆又一顆鑽石的最佳工具啊!不過這畢竟是人腦所想出來的,我們可以把人類的好奇心變成一套規則讓 AI 去學習嗎?

如果可以的話,我倒是很想好好整理自己好奇心的思路,可惜就是無法歸納啊。我經常在自問自答中,靈光乍現,又拐到某條路上找答案,最後又聯想到什麼之後再繞回來,或是又繞到新的地方去了。好奇心可以無中生有,演繹出各種可能性,但是要收納成一套 AI 可以重複利用的規則,這難道不是完全相反的方向嗎?

雖然實際上困難重重,但是對於 AI 發展的一日千里,解決日常工作的繁瑣,我真是殷殷期盼著啊~~(搖晃Alex肩膀:拜託你們加油啊)

下一篇:火熱的 AI 生成圖片,一起來看看相關產業怎麼看怎麼用?

若是喜歡我分享的內容,歡迎幫我按個拍手,可拍 50下,給我一點鼓勵,或是加入我的粉絲團《程式猿吃香蕉🍌,一起分享軟體知識與心得!

--

--

阿好 DamnGood
程式猿吃香蕉

我是阿好,也可以叫我阿~賀,喜歡觀察身邊的大小事。目前是靠著寫程式碼工作,業餘就用文字說說有趣故事。紀錄身邊奇人軼事