2018 AI 即戰力服務巡禮(3)- AWS ML Application Services

近一段時間以來,AI 與 ML 興起,帶起了新一輪的服務與體驗升級。接下來將會彙整現有的知名 AI/ML 服務,並介紹其中已能馬上使用的 API-Driven 服務,嘗試探索這些即戰力能為產品帶來怎樣創新

Terry Huang
安郡尼爾筆記
7 min readJun 8, 2018

--

What is AWS ML Application Services?

AWS 原文為 Amazon Web Services,是由亞馬遜公司所建立的雲端服務平台,提供包羅萬象的服務。早期知名的 EC2 就是 Amazon 提供的服務,目前 Amazon 也推出了以「機器學習」為基礎的 AWS ML Application Services,其中 API-Driven 的服務有以下六項

  • Amazon Rekognition Image: 深度學習影像分析
  • Amazon Rekognition Video: 深度學習影片分析
  • Amazon Comprehend: 文字理解分析
  • Amazon Translate: 文字翻譯
  • Amazon Transcribe: 自動語音辨識
  • Amazon Polly: 文字轉換語音

屬性

類型:雲端 API

可用性:GA+

收費:大部分有免費額度,超過額度後收費

REST:支援

SDK:支援 JAVA, .NET, NODE.JS, PHP, PYTHON, RUBY, GO, C++

MOBILE SDK:支援 Android, iOS, React Native, Mobile Web, Unity, Xamarin

深度學習影像分析 Amazon Rekognition Image

功能:物件和場景偵測

可識別數千種物件與場景

功能:不安全影像偵測

可偵測露骨和暗示性內容,包含可信度分數

太保守了,這個尺度就不行

功能:臉部分析

可以分析影像中的多個臉部並分析臉部屬性,以及其信心指數,例如:是否正在微笑、眼睛狀態、嘴巴狀態、是否有鬍子、是否有戴眼鏡、情緒如何,甚至還能預估年紀…等等

可分開觀看每個辨識出人物的分析資料(相片中梁相宜實齡 32)

功能:名人辨識

可識別各行各業中,有名、值得注意或表現傑出的人

Coldplay 鼓手,成功辨識,Amazon 太強大!

功能:臉部辨識

可分析兩張影像中的臉部是否屬於同一個人

  • Level 1: 林志玲 vs 暗黑林志玲
林志玲 vs 暗黑林志玲挑戰賽
  • Level 2: 宋芸樺 vs 夏宇喬
宋夏九宮格,宋芸樺辨識,有辨識出 3 張完全正確,有 2 張沒辨識出來
宋夏九宮格,夏宇喬辨識,有辨識出 3 張完全正確,有 1 張沒辨識出來
  • Level 3: 雙胞胎
已經判定相等,算是沒通過,但是相似度判斷依然正確

功能:圖像文字

可以找出和擷取影像中的文字,包括:道路號誌、車牌、T 恤、馬克杯、螢幕上的文字…等等

其他

  • 名人辨識 API 無權也不會提供完整清單。將會盡可能包含最多的名人,並持續增加新的名人
  • 名人辨識並不代表我們對該名人的評價
  • 名人如果希望從此功能移除,可請求移除
  • 影像文字只能辨識正負 30 度水平方向的文字
  • 圖像文字辨識,目前手動測試結果,應該只支援英文

價格

深度學習影片分析 Amazon Rekognition Video

擷取前一分鐘分析

功能:影像分析 Video Analysis

可分析影片中出現的人物、名人、物件、活動、爭議性內容

可選擇一個或多個辨識出的人物,會標記出現的場景片段(劉子千晉升亞馬遜認證名人
物建與標籤也可標記出對應的片段

其他

  • 支援檔案與串流

價格

文字理解分析 Amazon Comprehend

功能:自然語言處理 Natural Language Processing

可分析文句,進行關鍵片語擷取、情緒分析、實體辨識、語言偵測

功能:主題建模 Topic Modeling

從一個或多個文件中分析並擷取主題

其他

  • 目前支援語言:英文、西班牙文,「尚未支援中文」。如果想分析其他語言,可以先進行翻譯
  • 可與 Amazon S3 和 AWS Glue 整合使用

價格

文字翻譯 Amazon Translate

功能:以神經網路為基礎的翻譯

使用深度學習技術,比傳統翻譯模型更精確流暢

中文國小程度(被毆

其他

  • 支援自動語言識別
  • 支援檔案與串流
  • 目前支援英文和下列語言之間的翻譯:阿拉伯文、法文、德文、葡萄牙文和西班牙文。未來幾個月將支持六種其他語言,包括日文、俄文、意大利文、簡體中文、「繁體中文」,土耳其文和捷克文

價格

自動語音辨識 Amazon Transcribe

使用 Newsroom 著名的片段來實驗,擷取 3:18 之後

功能:自動語音辨識 (ASR)

語音轉換文字功能

準確度蠻驚人的,可獲得個別字會的時間標籤與信心指數

功能:可自訂詞彙

可以將特別行業名詞、名字或是新的字彙新增至辨識列表,來提高精準度

功能:辨識多個喇叭

能夠判斷發言者,對於轉錄電話、會議或是電視節目非常有用

發言者辨識則差強人意,可能是因為電影片段有運鏡的關係

其他

  • 目前支援語言:英文、西班牙文,「尚未支援中文」

價格

文字轉換語音 Amazon Polly

功能:深度學習技術的文字轉換語音服務

逼真的語音服務,強烈建議試聽,效果遠勝本機端的 TTS 服務

其他

  • 支援數十種語言,支援韓語、日語,「尚未支援中文」,詳細的語言支援列表可以參考這裡
  • 支援檔案與串流
  • 可調整抽樣頻率,適配各種裝置或是網路環境
  • 可調整語音速度、聲調與音量

價格

作為一家網路雲端服務的先驅,Amazon 一直受到開發者的喜愛,也有非常多的國際廠商將產品進行深度的整合,像是 Pinterest, Hotels.com, Isentia, Infor, The Washington Post, Elementum…等等,其中更不乏已經商用化的成功案例

此外,Amazon 服務的一個特點是 Full-Managed,幾乎可以在確認的效率與可預估的時間內完成任務,非常適合導入成熟產品的服務

--

--

Terry Huang
安郡尼爾筆記

Co-Founder of LiRise Co.,Ltd. In charge of innovative affairs development. Tags: Guitar, Golf, Photograph, Cocktail, Dance, Diving, Travel.