AWS re:Invent 2018 Day 3

俗話說的好:『參加 re:Invent 才知道體力不好』,為了 keynote 一早 6:15 就起床,6:30 出門。整天的議程結束後,晚上再來個大中華區酒會,明天還是一早要出門去聽 CTO 的 keynote。真的是套句 XiaoFan 去年常掛在嘴上碎念的:『累到快往生了!』

AWS re:Invent CEO keynote

如果要簡單講一句話形容今年的 keynote,我覺得基本上就是 Machine Learning Keynote —大概 1/3 的內容在講 ML。前年 Google 的 AlphaGo 橫空出世,嚇壞一堆科技巨頭,AWS 連忙在去年的 re:Invent 推出 SageMaker & DeepLens,並開始不斷利用客戶服務與銷售管道去傳達:『AWS 是 AI / Machine Learning 的專家』。 去年聽的時候覺得還好,今年的 re:Invent 就看到 AWS 狠狠地回擊 Google GCP 的優勢了 (至少在 PR 宣傳上),基本上除了新推出用來玩 reinforcement learning 的 DeepRacer 硬體,圍繞在 SageMake 上 AWS 已開始建立一個生態圈。細節直接看這次 Keynote 的官方 Blog 即可:

比較感興趣的發表像是:

  • S3 Glacier Deep Archive,價錢只要 $0.00099/GB-mo
  • Quantum Ledger Database: 加密過的,只能 append 無法刪除修改的分散式帳本 database,支援 SQL 語法並且效能優於常見的 blockchain framework。
  • AWS Managed Blockchain: 不是幫你做 coin,而是用 managed blockchain 來幫有需要的用戶做到 “去中心化的交易認證機制” ,而免除為人詬病常見 framework 交易速度不快的問題。以上兩個其實蠻聰明的,不著重在投機的虛擬幣本身,而去看新技術能為原本的 IT 產業解決什麼問題。
  • Amazon Timestream: 連續而且永遠會帶一個 timestamp 的資料通常都稱為 time-series 資料。一直以來這類資料要嘛透過另類儲存系統做 — 不具擴充性與效能欠佳,再不就是用 RDBMS 來處理 — 在效能與成本上一直都是 overkill,也增加開發成本。特定的 time-series DB 有助於有效的解決 IoT 常會遇到的問題。
  • Amazon Forecast: 都提到 time-series 資料了,其實電子商務的銷售數字本身就是 time-series data。AWS 號稱把 amazon.com 的供應鏈管理預測 ML 演算法拿出來讓大家使用,就是所有 time-series 資料都可以 forecast — 是的,歷史股價也是一種 time-series 資料,我想很快就可以看到有人分享拿來預測道瓊指數或是油價這種文章。
  • Amazon Personalize: 號稱 amazon.com 認證的推薦演算法,心動嗎?目前還在 preview 階段,有興趣可以去申請來玩玩看。

另一個特別的發現是,自從 2015 年 Amazon 收購晶片設計公司 Annapurna Labs 後,去年就已透過自製的 ASIC 來打造 Nitro System — 效能逼近極限 bare metal 的新一代 hypervisor 架構,今年也基於 Nitro 推出了不少網路效能及 security 的改善。而 Annapurna Labs 也是今年以 ARM 架構設計的自有處理器 AWS Graviton 的功臣。新推出的 Amazon Elastic Inference,猜測也跟 Nitro 與 Annapurna Labs 有關,ML 推出的硬體 DeepLens & DeepRacer 應該也用上了 Annapurna Labs 的 chip。

看來各個軟體科技巨頭們已開啟了,買自己 IC design house 來開發專用 chip 的時代 — 這樣的潮流之下,突然覺得 TSMC 應該會是最後的大贏家,畢竟半導體製程與良率跟效能成本息息相關。連 AMD 都給 TSMC 做 CPU 了,大家也一定在競爭這些稀有的製程產能,這樣說來,『buy TSMC』似乎好像才是辛苦工作之外,最重要的 action item。

四年前聽到 TensorFlow,立馬去研讀 Deep Learning,跟立馬去買 nVIDIA 股票,這兩種人四年後誰賺的比較多呢? :)

Easily add real-time recommendations to your applications with Amazon Personalize

這場 workshop 很讓人失望,讓我可是結束之後不忘抽空利用大中華區酒會的空檔,狠狠地給講者很爛的評價。

應該是因為還在 preview 很新的階段,console 還有些 bug,dataset schema 跟 CSV 內容還搞錯,整場應該沒人跑出結果來。我覺得直接看官方介紹 blog 用 CLI 操作一遍應該還比較實際。

講結論的話,我覺得就還是在 preview 階段,沒有講得那麼神奇,內建的 recipes 種類不多,也不知道效果好不好 (至少講者建好的 solution,不管 item 怎麼打,給出來的推薦都固定,很欠缺說服力)。而 dataset 也只有 User, Item, User-Item interaction 這三種可以提供,可能彈性不足 (或是有其他更細的 config 方式或做法)。


Deep Learning Applications Using TensorFlow

講解很多如何結合 TensorFlow (以及其他 framework) 與 SageMaker 來打造 Machine Learning 應用的 session。