After AI Forum 2018

楊皓崴
無詩的羊圈
Published in
5 min readMay 14, 2018
AI Forum 手冊 and 筆記

上禮拜因參加AI Forum而去了一趟台南,雖然聽了不少也記了不少,卻不清楚真的派上用場的又多少,不過倒是攫取了許多靈感,聽著別人講很不一樣的事情時,天馬行空的思緒得以找到落地點的那一刻,靈感就莫名的出現了,之後大概又將會是兩三個禮拜的忙碌(一個禮拜下來確實很忙不過又因外務偏掉了XD)。

以個人的角度去切分的話,AI Forum 2018 議題主要圍繞在NLP、海外技術分享和AI教育這三大事件上。

自然語言處理(natural language processing)是將人類語言做分析,使得電腦能解讀一段文字的意義或其他訊息,由於檢索、社群網站、文字對話紀錄等工具的文字資料特性,以商業角度來看是相當迫切的議題,在此次論壇上有多個主題提及,但各自的處理狀況都有所差異,原因可能為:資料形式差異(對話、檢索、短文…等)、附加資源不同(有無額外訊息)、以及不同語言之間不互通的部分(基本文法差異、斷詞和詞性標籤工具的完整性)。除了兩位企業講者分享各家公司在客服和app上應用的大方向、Appier公司的郭盈希博士將文字作為圖片檢索的輔助特徵(當中除影像處理本身,對社群和地理資訊的使用值得借鏡)之外,Keynote I: NLP for Short Text Understanding 的王海勛博士對短句問題的敘述詳細許多。
王博士表示,自然語言是一種 sparse, noisy and ambiguous的資料,以英文為基底的觀點下,如同twitter訊息、FB po文和文章標題這類有明確字數限制或者通常篇幅短小的句式稱作短句,而NLP的中心任務為確認 P(mean|text,context) 的最大可能性(呃…分布狀況? 我講的似乎不太精確w)。
就目的而言,我來聽完Keynote I似乎就可以離開了XD(就貴到不行的門票而言不行OwO),而且王博士後續提及的操作是否能套到中文,感覺都有些難度。加入Graph search概念讓詞的節點合理連貫並藉由句子內出現的詞去對應路徑,從而解決問題,通常在FB的網絡資料下,會有比較好的效果;而對於RNN模型的使用則要考量解釋性問題,需大量的rule based標記動作,應是商業需求下的解法;對句構的探討算是個人比較沒有想到的,在極短句中構句詞可能相對有足夠的數量能提供解釋,詳細可能參考王博士的Medium[1]

論壇上亦有他國或是在他國工作的講者,但部分場次由於一些因素,個人難以深入了解,可能因為商業機密也不方便多講太多吧。比較有印象的是來自新加坡的林一平教授以及與日本民營電力業合作的顏哲淵執行長,林教授以Smart city為講題,介紹了新加坡目前資料科學的應用並以星國重視的”業食住行”四個主題中以食為例介紹了一款飲食紀錄的app,其提供給使用者拍照上傳的食物的營養資訊(條碼或星國常見食物(已建有資料庫)),並記錄使用者的飲食狀況與健康的飲食做比較給使用者參考,教授也對其資料分析做了解釋,說明人群後續的反應以及可能改進的方向;顏執行長則是發展IoT起家,因被日本能源相關領域人員相中,而於日本發展智能電表相關產品[2](輔助撰文,怕自己記憶有誤XD),基於日本能源民營化的特性,對用電精確控制產生需求而得以發展如長照、宅配路線規劃等延伸應用。
兩場演講的應用有別於台灣適用的環境與法規,雖不一定能直接與自身經驗連結,但也多了一些想像,或許有機會出國的話,從自然、政治、或人文的差異性將會是個人要觀察的一大課題。

人才培育部分由於目前業界對相關領域人才的需求相當的多,但對於應徵者需具備何種特定專長和如何培育其實並沒有標準可參考,為此,人工智慧學會將各領域由淺入深的製成課程地圖放在網路上供大家參考[3],並向各單位徵件提供開放課程,讓社會大眾易於取得相關學習資源。
對於這樣的推廣,雖有些擔憂競爭更加激烈,不過更多的還是感謝學會的付出,畢竟社會大眾對AI的理解直接影響到資料科學家和工程師工作上的難易度,從提供的資料到期望的產出,若沒有概念對雙方而言只會浪費時間,期望台灣出產的資料能逐漸走上檯面,至於個人的競爭,成匠成師就各憑本事了,或許在技術與學問之間能夠明確的劃分並各自深入掌握,在這個領域能活得自在一些。

以上,感謝各個聽我口述心得的聽眾,在拿捏跟朋友聊天和放在網路上的貼文差異後我刪掉了一大段(垃圾話真的太多了XD),過程中,除了技術知識的接觸也點到一些時局問題,免不了又是一些往後要考量的隱憂,或許等有機會再聊。也感謝說要幫我要資料的大大,雖然也是因各種商業機密、學術機密而不了了之,但我會再自行挖掘的。歷經一個禮拜的與各方接觸下(這)週回歸日常篇先從數學複習開始,希望先放個線性代數不然最近的應用我再卡基礎知識就要出事情了OwO。

Link
[1] 王博士的Medium:https://medium.com/@haixun
[2] 吳元熙(2017年12月05日)。被日本能源專家看中,台灣新創攻智慧電錶,引來三大電力公司搶合作。取自 https://www.bnext.com.tw/article/47126/taiwan-startup-nextdrive-iot-energy-management-solution-welcomed-by-japanese-market
[3] 台灣人工智慧教育平台:https://idea.cs.nthu.edu.tw/~AIcoursemap/home/index.html

--

--

楊皓崴
無詩的羊圈

資料科學見習者,交大數據科學與工程研究所碩士生,正與資料探勘和資料視覺化培養感情的一頭羊。Data science, Python coder, beep beep, M.S. of D.S. student.