2018 AI 即戰力服務巡禮(1)- Google Cloud AI

近一段時間以來,AI 與 ML 興起,帶起了新一輪的服務與體驗升級。接下來將會彙整現有的知名 AI/ML 服務,並介紹其中已能馬上使用的 API-Driven 服務,嘗試探索這些即戰力能為產品帶來怎樣創新

Terry Huang
安郡尼爾筆記

--

What is Google Cloud AI?

Google Cloud AI 隸屬於龐大的 Google Cloud Services 雲端服務中,集成了雲端 ML 相關的服務,API-Driven 的服務有以下五項

  • Cloud Vision API:圖像分析相關功能,將圖像解析出各種有用的資料
  • Cloud Speech API:語音識別相關功能,提供各國的語音轉文字服務
  • Cloud Natural Language API:自然語言理解相關功能,把文字解析成有用的內容。
  • Cloud Translation API:動態翻譯數千種語言的文本
  • Cloud Video Intelligence API:視頻分析技術,解析影片中各種資訊,以及動態辨識的綜合資訊

屬性

類型:雲端 API

可用性:GA+

收費:大部分有免費額度,超過額度後收費

REST:支援

SDK:支援 C#, GO, JAVA, NODE.JS, PHP, PYTHON, RUBY

圖像分析 Cloud Vision API

功能:標籤偵測

可偵測圖片中包含的多種類別的物件

功能:安全搜尋偵測

可判讀圖片中是否有的爭議性內容,例如:成人、詐欺、藥物、暴力、兒童不宜…等等

這標準實在是很保守

功能:標誌偵測

可偵測圖片中熱門的產品標誌

功能:地標偵測

可偵測圖片中熱門的景點、建築物

功能:光學文字辨識

可偵測、擷取出圖片中的文字,支援多種語言,自動語言辨識功能

功能:臉部偵測

可偵測圖片中的多個臉部,並且能夠偵測相關的資訊,如:表情,還會有相關資訊的信心指數

功能:圖片屬性

可偵測圖片屬性,例如顏色相關訊息、裁切建議設定

功能:網路偵測

可在搜尋出相似的圖片的關鍵詞

其他

  • 可整合 Google Cloud Storage 來使用
  • 臉部偵測臉部識別並不相同

價格

語音識別 Cloud Speech API

功能:自動語音辨識

採用深度學習神經網路技術的自動語音辨識 (Automatic Speech Recognition, ASR)

擷取 1:11.1 ~ 1:12.4
請依個人喜好解讀

功能:包含全球詞彙

能夠辨識超過 80 種語言和方言

功能:文字提示

可預先提供可能出現的文字來進行語音識別

功能:支援串流、即時或預先錄製的音訊

支援即時串流辨識、麥克風擷取,或是預先錄製的音訊檔案

功能:不當內容篩選

部分語言提供針不當內容篩選功能

其他

  • 能對抗雜訊,不需要額外預先進行清晰化處理
  • 隨著 Google 改善 Google 產品使用的內部語音辨識技術,Speech API 的正確性會隨之提高
  • Speech API 支援任何可以傳送 REST 或 gRPC 要求的裝置,包括手機、 電腦、平板電腦及 IoT 裝置 (例如汽車、電視、喇叭)。

價格

自然語言理解 Cloud Natural Language API

功能:語法分析

能夠樹狀結構化的剖析文具、辨識詞性、判斷詞彙的依存性

功能:實體分析

能夠解析出關鍵詞彙,比如語句中包含的:人物、機構、地點、事件、產品、媒體…等等

功能:情緒分析

能夠解析整體,或是分別拆解各語句所表達出的整體情緒感受。是正面或是負面語句,以及其情緒的強度

功能:多語言

支援 80+ 語言的文字,包括英文、西班牙文、日文、中文 (繁體和簡體)、法文、德文、義大利文、韓文和葡萄牙文

其他

價格

動態翻譯 Cloud Translation API

功能:多語言

支援超過 100 種語言,也支援不同語言組合的文句

功能:語言偵測

可不指定解析語言,自動偵測原文的語言

Google 中文程度尚淺(被毆

其他

  • 具備自我學習能力,可透過紀錄分析和人力翻譯範例來學習
  • 可調整每日配額
  • 可以接受網頁的 HTML 進行翻譯,可直接譯出同樣架構的翻譯內容
  • 詳細語言支援可以參考這個網頁

價格

影像分析 Cloud Video Intelligence API

功能:標籤偵測 Label Detection

偵測整段影片中,可能符合的主題標籤,以及信心指數,目前可標記 20,000+ 以上標籤

功能:場景變動偵測 Shot Change Detection

偵測大場景變動的時刻,同一個場景的視角變化會被看作同一個場景,並會針對該場景給予標籤偵測

功能:不適當內容偵測 Explicit Content Detection

偵測是否有成人內容,依據每個 Frame 來判讀屬於成人內容的可能性

其他

  • 可整合 Google Cloud Storage 來使用

價格

Google 身為雲端服務的領航者之一,Google Cloud AI 可以說是非常的完備且強大,針對文字、圖片、聲音、影像都有 AI 智能分析的對應功能,也已經有非常多國際大廠搶先導入服務中,比如:Platinum IDS, Ocado。趕快跟上這波浪潮開始繳錢給 Google 吧(被毆

--

--

Terry Huang
安郡尼爾筆記

Co-Founder of LiRise Co.,Ltd. In charge of innovative affairs development. Tags: Guitar, Golf, Photograph, Cocktail, Dance, Diving, Travel.