好口語化的標題,不是太滿意

會有這個想法除了自己因為背景的關係會比較有興趣外,主要是因為上個月看到了這篇 Mashable 的文章:Of course Parisian Google is developing AI experiments for the art world。文中介紹了一些 Google 位於巴黎的 Art & Culture 實驗室如何使用機器學習,增進我們對於藝術作品的理解與接觸。

文中介紹了影片裡提到的幾個應用

  1. 自拍:就是拿你的自拍照去資料庫配對相似的藝術作品,誰是明星臉的文青版本,以利年輕人親自藝術作品。
  2. 生活雜誌:把生活雜誌裡的照片全部拿去給 AI 看,自動下標籤做分類,方便搜尋存取。
  3. 藝術調色盤:用小量顏色的搭配,搜尋其他藝術作品、設計作品、或攝影作品。類似過往的配色工具,啟發藝術、設計工作者的靈感。
  4. 我在看什麼?(我自己取名的):記得之前有個手機程式很夯,如果你聽到一首歌很喜歡不知道叫什麼名字,開程式錄音 10 秒就會自動搜尋到你正在聽的歌。這個就是 MoMA 的版本,只是換成拍藝術作品的照片,然後顯示該作品的說明。

以上連結都來自一個名為 https://experiments.withgoogle.com 的網站,其中的 Art & Culture Experiments 分類,其他分類還有

  • AI Experiments
  • Android Experiments
  • AR Experiments
  • WebVR Experiments
  • Chrome Experiments
  • Voice Experiments

裏頭滿多有些知名度的專案,例如 AI 的 Teachable Machine 或是 AR 的 Draw Anywhere with AR

看完以後當然立馬追蹤實驗室負責人 Damien Henry 的推特,馬上就看到一個有趣的實驗:用 AI 去畫人物畫像,學習的圖像是來自 1900 以前的油畫。作者是這位 Mario Klingeemann,不得了啊,followers 包含 Andrej Karpathy 、Keras 作者 François Chollet、distill 的 Chris Olah 這些大神們!自我介紹寫著:『Artist, Coder, Data Collector, Archivist, Speaker, Obsessive Compulsive Orderer, #AI #ComputationalArt #Glitch #MachineLearning Artist in residence @googleart』難道是一種駐村藝術家的概念?

看下來感覺 Google Art & Culture 比較著重在影像方面,AI 與音樂方面有TensorFlow 的 Magenta 還算是有個開端,看之後有沒有什麼突破性的專案。相較前面兩種型態,AI 與文學方面的規模就都比較小,寫寫藏頭詩,或是學學金庸、紅樓夢、莎士比亞之類的,台灣本土最近看到的應該就屬致敬張雨生歌詞產生器了。

一時興起了解一下 Google Art & Culture 都在幹嘛,Mashable 文中提到一點我覺得滿喜歡的,就是這些專案除了跟藝術結合,需要用到新的人工智慧技術之外,還有一個共通點就是都很有趣(Fun),以推廣為目的來說,這點是真的很重要。未來有機會的話會持續關注這個領域。


這篇文章本身就是很多東西的摘要了,要給一篇滿滿摘要的文章再寫摘要,感覺就剩下沒什麼東西了,不過還是試試看吧,先來列一下大綱:

  • 強化學習稱霸人類遊戲
  • Evolution Algorithm & Genetic Algorithm
  • WaveNet, CNNs, Attention Mechanisms
  • 深度學習框架百家爭鳴
  • 學習資源推薦
  • 各種應用
  • 數據集
  • 深度學習的可重複性與批判
  • 其他事件

原文有非常多的連結,包含論文或是網站,看完不知道都 2018 年幾月了啊!下面列一些我有興趣的點,其他看標題就可以猜內容的就不寫了。

強化學習稱霸人類遊戲

這個中文副標故意下地比較誇張了,當然這部分原文把 AlphaGo 系列都提了一遍,後面提了一些其他棋類、撲克比賽或是其他遊戲競賽,總歸一句話就是說呢,現在電腦跟人只有一對一的遊戲是會贏的,但是多 …


這篇文章比較新,因為其實是 PyTorch 一週年文,不過 PyTorch 是在 2017 一月發佈的,所以 PyTorch 一週年紀念文,跟 PyTorch 2017 回顧文其實差不多意思,所以也就一起寫在這個系列。一樣先列一下大綱

  • 社群 Community
    - 論文 / 套件 / Github
    - 指標
    - 課程 / 教學 / 書籍
  • 工程 Engineering
    - High-Order Gradients
    - 分散式 PyTorch
    - 更接近 NumPy
    - 稀疏張量
    - 效能
    - 輸出使用於產品階段的模型
  • 可愛的使用者

套件

演算法實作

視覺化

教學

線上課程

工程

這個段落主要是一些 pytorch 使用性的增強以及效能提升的描述,這部分我就不再列一次了。

可愛的使用者

最後引用的 Karpathy 大大的一則搞笑推廣文引起的一連串 retweet

結語

我想對於想要開始學習 PyTorch 的人來說,這篇會是一個很好的資源,可以判斷用這個框架的優勢,以及目前各種相關的輔助套件。我自己是覺得目前 PyTorch 的 ecosystem 還是不如 TensorFlow / Keras 完整,但是在 NLP 相關研究上的使用相對於其他研究或是其他框架是有比較多的趨勢。


原文連結:part 1, part 2

第一部分是核心研究

  • 自動化機器學習 AutoML
  • 語音理解與生成
  • 新的機器學習演算法
  • 計算機系統的機器學習應用
  • 隱私性與安全性
  • 理解機器學習系統
  • 開放數據集
  • TensorFlow 與開源軟體
  • TPU

第二部分是特殊領域研究

  • 醫療
  • 機器人
  • 基礎科學
  • 創意
  • People + AI Research (PAIR)
  • 機器學習的公平性與包容性
  • Google Brain 的文化

大綱就以跨頁了,內容我就隨自己的喜好意思意思寫了XD

AutoML

語音理解與生成

  • 語音理解的部分在 Google 語音辨識系統的錯誤率降低的 16%
  • 這篇列了 10 篇論文
  • 語音生成系統叫做 Tacotron …

2017 最後一天,把 Kaggle 12 月的文章看一看,扣掉之前提前一篇跟11 月的一起看了,目前有三篇新的:

  • Kaggle 2017 回顧
  • 賓士競賽首獎訪談
  • 汽車遮罩首獎訪談

Kaggle 2017 回顧

  • public dataset and kernels 的耀眼成績
    以往大家在 Kaggle 就是參加競賽居多,今年 Kaggle 滿用心推 public dataset 這個產品的,也有舉辦活動,每個月挑選 public dataset 發獎金。下載量來到 350K 左右,跟競賽資料的下載量差不多,算是很大的提升。public dataset 跟 kernel 的資源限制(資料空間、運算時間、記憶體等)在今年也有增加,感覺之後成長會更大。
  • 競賽方面也破紀錄,安全駕駛的競賽參加人數超過 6000 人,是 Kaggle 目前主辦人數 …

最近公佈結果的折價券競賽,使 Kaggler 排行產生新的冠軍,bestfitting!

在閱讀十月 Kaggle 官方網誌的時候,讀到 bestfitting 的亞馬遜競賽冠軍分享就有注意到他的戰績簡直嚇人,沒想到這麼快就看到他成為新的冠軍的消息。僅僅用了 15 個月 10 場比賽就登上冠軍寶座,以前沒有這麼認真關注 Kaggle,所以不知道有沒有破紀錄,但是光看他的競賽成績頁面,下巴就是合不起來。

那這篇文,就來收集整理一些 bestfitting 的分享吧!

Kaggle 官方網誌

討論區留言


感覺從第一次聽到 GAN 這個詞到現在也很久了,尤其過去一年台灣資料科學年會也邀請台大李宏毅教授給過很多次的分享以及課程,所以這個詞在同溫層裡一直沒消失過,直到這幾天因為工作上需要才認真學習了一下,這邊紀錄一下找到的資源,以及我閱讀、觀看的順序給大家參考。

資料來源

基本學習

  • Introduction to Generative Adversarial Networks by Ian Goodfellow (from NIPS 2016 Workshop on Adversarial Training) [youtube (~30 mins)] [slide]:非常簡單地介紹 GAN
  • Generative Adversarial Networks by …

接續把 11 月 Kaggle 官方網誌看完,總共五篇:

  • 產品發表:Dataset 資源增加
  • 十月 Dataset Publishing Awards 首獎訪談
  • “Data Science for Good Events” 介紹
  • Neural Network 介紹
  • Neural Network 介紹第二部分:計算舉例

產品發表:Dataset 資源增加

從 11/15 開始,使用者可以在 Kaggle 上面分享資料集的限制修改了。

  • 500Mb -> 10Gb
  • 1000 ZIP files -> 無限(需要是 ZIP file)
  • 第一層只能 20 個檔案 -> 50 個

十月 Dataset Publishing Awards 首獎訪談

第一名的 Dataset 是美國過去 50 年的大規模槍擊事件,數量從數據的角度來說不多,但是從悲劇的角度來說算滿多的,398 起。第二名是法國勞工薪資以及城鎮人口數據。第三名是巴 …


恩,十一月初忘了看 Kaggle 十月的網誌了。總共四篇:

  • 文本情感分析教學 in R
  • 亞馬遜雨林競賽首獎訪談
  • 九月 Dataset Publishing Awards 首獎訪談
  • 發表 Kaggle 2017 資料科學暨機器學習現況調查報告

文本情感分析教學 in R

這是 Kaggle 的工程師發表的一篇教學,用美國 1989 ~ 2017 年的國情咨文資料庫來做文本情感分析。除了 Kaggle 官方網誌以外,該文在 Kaggle 上也有一個 Kernel 讓你可以直接跑跑看,或是 Fork 出來做練習。主要是使用一個叫做 tidytext 的 R 套件,不過我不會寫 R,自己寫了一份 python 的版本,對照看一下,覺得 R 語法有點神奇。文末附上了三個練習題,以及其他在 Kaggle 上面語言相關的資料集,還有外部的資料 …


因為買了 kindle 閱讀量有稍微多一些,但是因為不在電腦前面閱讀,其實寫得比較少。這個月比較空窗,大事件都結束了,心思稍微往其他地方多放了一些,在社群上的動作比較少。

社團部分

個人部分

總結

這個月有點混亂。還在重新規劃在社團、粉專、碼天狗週刊等不同渠道分享的內容,資訊的來源,以及自己的筆記。其實這個月因為買了 Kindle,閱讀量比過去都大,但是也因為用 Kindle 看,閱讀的情境以及裝置都不適合做進一步的筆記。為了練習,也另外找地方開始寫筆記,結果寫了一次就懶得再發一次,導致分享出來的東西,有點失焦、有點混亂、有點少。

其他

Kaggle 在 12/4–8 會有兩個入門級的 Data Challenge,有興趣的可以參考

Rick Liu

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store