本文所使用圖皆截自原論文
編按:在優拓每週一次的 Seminar,Data Team 的大夥會輪流分享最近看過的一篇印象深刻的論文。這一系列文章就是將會議上討論的內容整理出來,分享給優拓以外的同好。本系列的前一篇請見:
本篇論文為 Deepmind 提出的一種 source-target 網路架構,利用 WaveNet [1] 以及 pixelCNN [2] 的基礎,達到線性時間實現 character-level 的機器翻譯,目的是可以完成更長句子的翻譯任務。
註:以下的圖皆截自這篇論文 《Make SVM Great Again with Siamese Kernel》
早在 2000 年初,史丹佛教授李飛飛以及 Hinton 等人即提出 Few-Shot Learning 這類問題,但沒受到較大關注。由於優拓的 NLU 自動訓練系統,經常需要面對這樣情況,因此我們特別關注相關領域發展。
《Semi-supervised sequence tagging with bidirectional language models》by Matthew E. Peters, Waleed Ammar, Chandra Bhagavatula, Russell Power註:以下的圖皆截自這篇論文