【DataRobot 重磅介紹】ML 訓練師的新武器?AutoML自動化機器學習平台

相信在不久的將來,在各種企業場合上,不會再有人問你家公司有沒有導入 AI 應用。就好像在跑場上,當大家都在向前跑時,已經沒人會問你懂不懂得跑步,而是問你能跑多快。

PGi 樺鼎商業資訊
PGi 樺鼎商業資訊

--

If your competitor is rushing to build AI and you don’t, it will CRUSH you. — Elon Musk

PGi樺鼎商業資訊-DataRobot 全台代理
2022年第三季The Forrester Wave 報告,精選15家AI平台,DataRobot 為其中前三大領導品牌

本文重點

  1. AutoML 是什麼? 為什麼會有 AutoML 的出現?
  2. DataRobot 在哪些階段幫你自動化了?
  3. 為什麼 DataRobot 可以做到,到底厲害在哪裡?

一、AutoML是什麼? 為什麼會有 AutoML 的出現?

AI-Driven enterprise will steal $1.2 trillion from competitors by 2020 — Forrester.

在可預見的未來,似乎更是一個贏者全拿的世界,企業所擁有的財富即將重新分配。

但,難道未來只有大者恆大、贏者全拿這條路嗎?

那些沒有資金買下一家AI start-up、沒有搶到AI人才的、現在還在培育的、或甚至不知道怎麼培育的,難道就只能註定是這場時代戰役的輸家嗎?

回歸企業內部去思考,有沒有什麼方法,是能讓既有的人才更快變成你所期待的AI人才?讓既有的數據分析師/工程師加速升級為資料科學家、或是怎麼讓既有的資料科學家提高生產力

我們相信這就是 AutoML (Automated Machine Learning) 的存在價值

給那些 80%正努力嘗試進入 AI 領域但力有未的企業,一個加速的機會

什麼是 AutoML (Automated Machine Learning)?

簡單來說,就是幫助開發團隊&懂資料意涵的人不需要高度的程式技術就能完成特定的 AI 應用目標,讓這些人可以更專注在:

  1. 判斷要讓機器去學習「什麼問題」
  2. 蒐集目標問題的所有相關資料(Domain know-how 很重要)

至於「訓練」機器怎麼學習這段,就讓它自動化吧!

這是一個加速迭代的解決辦法,AutoML 輔助這些還在研究、實驗怎麼訓練機器學習的人(簡稱 ML訓練師),能快速得到反饋,針對反饋重新蒐集數據,更快進入下一輪的訓練或最後一哩的應用。

AI 簡單說 DataRobot 創辦人3分鐘解釋什麼是AutoML

二、機器學習為什麼很耗時?一張圖看 DataRobot 在機器學習的哪些階段自動化處理了?

一般來說,在確認目標問題、也蒐集好相關數據後,要開始訓練機器有自我學習能力時,會在以下四個步驟最耗時,其中 Data processing 跟 Feature engineering 是最常被低估的地方,且步驟1、2又是密切相互影響的

  1. Pre-processing 準備資料: 特徵工程、挑選重要變數、缺失值處理、檢查變數類型等
  2. Modeling 選定適當演算法來模擬資料+調整演算法參數,優化模型
  3. Model Assessment/Validation 評估模型的準確度
  4. Deployment 上線應用

Data processing and feature engineering are often overlooked, even though they are essential to building a great model and are much more complicated to master.

DataRobot 2012年創立以 AutoML 起家,至今依舊AutoML最強,全平台也已涵蓋整個 AI 開發生命週期所需功能
文字版說明:4分鐘帶你了解 DataRobot 從AutoML 到 MLOps 重點功能
DataRobot_核心技術model blueprint
DataRobot 核心技術 Model blueprint 拆解

三、好奇 DataRobot 為什麼有辦法把複雜又耗時的訓練階段變得又快又準確?

我們往往因為有限的訓練時間、有限的演算法知識與選擇,等同於自動放棄追求更合適的模型。

Q : 如果不考慮模型訓練的時間,你會選擇用3–5個演算法來模擬資料,還是用 100個演算法來模擬資料?

多數人會選擇後者,為什麼?因為他們知道「模型準確度」是訓練結果的關鍵指標、也是上線應用後衡量效益的重要因素之一。

少數人會選擇前者,為什麼? 因為他們不知道可以有100種選擇。或只偏好特定幾種演算法。

There is no one recipe that works consistently across problems, meaning that limiting yourself to one or two standard practices won’t result in the most accurate possible outcomes.

全球頂尖資料科學家團隊,將業界公認的大師經驗,內建入平台中,並根據市場最新的開源機器學習框架,不斷新增與測試,以讓 DataRobot 平台保持最優化的狀態

DataRobot 相當於是 Kaggle-top-ranked Data Scientists 的智慧與經驗集成,其中的 Model Blueprints 是加速升級的學習指南

DataRobot 除了內建上百種這些全球頂尖資料科學家訓練過的模型、並自動排名模型的優劣外,更重要的是,這過程一切透明化、可被解釋的」,在追求速度的同時,也藉此有系統的學習如何更精進調教機器學習的技術。

With the help of our Kaggle-top-ranked data scientists, DataRobot built a comprehensive, best-in-class machine learning framework to help anyone develop and deploy great models regardless of data science skill level.

身為ML訓練師的我們,可以透過 DataRobot 的 Model Blueprints 知道以下的事情:

  1. 數據做了哪些預處理?
  2. 做了哪些特徵工程?
  3. 總共用了哪些演算法來模擬資料?

以上3點,都提供完整的資料解釋背後的運作,包含:每個演算法預設的參數跟選項、外部原始資料連結等

An example of a model blueprint generated automatically by DataRobot for training a Regularized Logistic Regression algorithm

Companies that start preparing today will position themselves to thrive in an environment redefined by AI.

👉 繼續閱讀更多

🔹 2022年最新:4分鐘帶你了解 DataRobot 從 AutoML 到 MLOps 的重點功能

👉 更多實際應用案例

🔹 台灣中央氣象局導入 DataRobot 分享:用 DataRobot預測雲、偵測霧🔹 DataRobot 可以做哪些預測?解析日本、歐洲、南美共4個經典案例
案例 ❶:全球第二大生鮮零售商Kroger
案例 ❷:日本FamilyMart用DataRobot評估跟預測最適合展店的地點
案例 ❸:法商家樂福用DataRobot加速驗證創新想法
案例 ❹:聯想集團Lenovo在巴西的營運部
🔹 DataRobot 文章與資源合集🔹【金融業應用】用DataRobot 降低營運資金貸款壞帳率🔹【金融業應用】用DataRobot 改善 AML Program 的執行效率

若想更深入了解 DataRobot,歡迎前往 PGi 官網預約Demo,我們迫不及待想幫你加速 🚀

PGi 樺鼎 RPA、BI、AI 平台整合方案 UiPathAlteryxTableauDataRobotDataikuOlation
PGi 樺鼎商業資訊,專注提供能快速落地的 RPA 到 AI 應用解決方案與專案諮詢,核心信念是為台灣企業打造「最省力的數據決策模式」。目前累績超過 300 家知名企業長期配合,我們相信,有品質又快速的決策力,是企業的隱形武器透過與各數據領域的領導品牌合作,如 RPA 流程機器人第一品牌 UiPath、視覺化分析平台 Tableau、資料清整流程自動化平台 Alteryx、自動化機器學習平台始祖 DataRobot、容易跨職能協作的資料科學平台 Dataiku 等,幫助不同數位成熟階段的企業,從最容易開始的數位優化,逐步走到各部門都可參與的數據分析與AI協作,打造精實的數位轉型之旅。服務內容:UiPath 培訓 Tableau Desktop 培訓 ▎專案開發|AI平台導入諮詢等

--

--

PGi 樺鼎商業資訊
PGi 樺鼎商業資訊

從RPA、BI 到 AI 平台,我們專注協助企業用最省力的方式,加速數據變現。From Data to Insight. Easier & Faster!歡迎造訪PGi 官網 https://www.perform-global.com