AI Booster - NVIDIA GTC 2023 (2)

DigNo Ape 數遊原人
IMU Framework Design
7 min readMar 27, 2023

The iPhone moment of AI has started.

Image credit: NVIDIA

這系列文章是透過蒐集、分享我覺得有意思AI服務、相關文章、影片,期許自己能更了解這世界上正在發生什麼。

上一篇我們回顧加速運算,這一切的基礎都要歸功於NVIDIA的DGX,而DGX也是現今人工智慧的核心基礎,第一台的DGX (DGX-1) 就是當年NVIDIA捐給OpenAI作為研究基礎,而後來的故事大家也知道了,OpenAI成為現在最火熱的人工智慧巨星。

隨著人工智慧的發展,DGX的市場也從當年的研究領域為主的客戶漸漸轉移至營運、商業用途,這也是老黃說的 :

人工智慧的「iPhone 時刻」已經到來

為了因應即將大量湧入商業化AI的需求,NVIDIA和Microsoft Azure、Google GCP 和 Oracle OCI 合力推出DGX Cloud, DGX Cloud 由 Base Command Platform 提供動力,是一種多節點 AI 訓練即服務解決方案,針對企業 AI 的獨有需求進行優化。

NVIDIA看好近期爆發式成長的生成式AI,與過去PC、網際網路、行動裝置和雲端服務,是一種全新的運算平台,解鎖了許多商業機會,就像近期我們看到大量的新創公司利用生成式AI在各領域創造出許多新的商業應用。

Debuild lets users design and deploy web applications just by explaining what they want. Grammarly is a writing assistant that considers context. Tabnine helps developers write code. Omnekey generates customized ads and copy. Kore.ai is a virtual customer service agent. Jasper generates marketing material. Jasper has written nearly 5 billion words, reducing time to generate the first draft by 80%. Insilico uses AI to accelerate drug design. Absci is using AI to predict therapeutic antibodies.

Image credit: NVIDIA

藉由 DGX Cloud,NVIDIA推出AI Foundations的創新的雲端服務,服務包含預先訓練基礎模型以及先進的框架、優化的推理引擎和 API,進而推動生成式 AI,客戶在這個平台可以使用自己的專屬資料(Proprietary data),訓練出客製化模型,並在模型內定義防護(Guardrails)以符合客戶的需求比如資安、隱私等。老黃把這個服務比喻成人工智慧模型的Foundry ,就如同台積電之於半導體產業一般。如同半導體晶片製造需要大規模的資本支出,有晶片生產需求的客戶自己生產晶片的門檻很高,客製化、訓練、部署生成式模型需要非常大量的資料、深厚人工智慧專業知識,輔以大規模計算才能以創新速度進行資料處理、訓練、部署和維護。

目前釋出的 AI Foundations服務涵蓋語言、視覺和生物三大領域,分別為Nemo (language)、 Picasso(visual)、BioNeMo (biology)。

Image credit: NVIDIA

NeMo

NeMo 是針對企業客製化和大規模部署智慧大型語言模型(LLM)的雲端服務。

客戶可以使用自己的訓練好的模型,或使用 Nemo 預訓練的語言模型,客戶可以根據自己的需求選擇以下NeMo生成AI 基礎模型:

  • GPT-8: 8 億個參數,配有監督式微調功能。在 1.1T 個標記上訓練,序列長度為 4 千個標記。提供快速回覆,能夠達到應用程式服務等級協議所要求的簡單任務。使用情境,如:文字分類、拼寫校正。
  • GPT-43: 43 億個參數,配有監督式微調功能,支援 50 多種語言。在 1.1T 個標記上訓練,序列長度為 4 千個標記。提供高精準和低延遲的最佳平衡。使用情境,如:電子郵件撰寫、問答集。
  • GPT-530: 530 億個參數,配有監督式微調功能。在 340 億個標記上訓練,序列長度為 2 千個標記。非常適合需要深入理解人類語言及其所有細微差別的複雜任務。使用情境,如:文本摘要、創意寫作、聊天機器人。
  • Inform: 適合需要最新專有知識的任務。使用情境,如:企業智慧協助、資訊檢索、問答。
  • BLOOMZ-T0: 支援 100 多種語言的社群建立模型,擁有 130 億個參數,配有監督式微調功能。訓練時序列長度為 2 千個標記。使用情境,如:語言翻譯、語言理解、問答。

Picasso

Picasso 是針對企業客製化和大規模構建、部署生成式 AI 驅動的視覺應用程式的雲端服務,NVIDIA使用最先進的預訓練 Edify 模型,客戶可由API 呼叫部署在 NVIDIA Cloud的模型,服務涵蓋:

  • 文字轉為圖像 (Text-to-Image)
  • 文字轉影音 (Text-to-Video)
  • 文字轉 3D (Text-to-3D)
Image credit: NVIDIA

老黃提到幾個與NVIDIA合作的夥伴:

  1. Getty Images 將使用Picasso Edify-image 和 Edify-video 服務客製化生成圖像模型,這些模型使用豐富的資料庫包含經授權的專業影像與影片素材,企業將能夠使用簡單的文字提示詞或影像提示建立自訂影像與影片。
  2. Shutterstock與NVIDIA 正共同開發 Edify-3D 生成模型,該模型使用完全許可內容(fully licensed content)專業影像、3D 和影片素材資料庫進行訓練。讓企業能夠更快、更輕鬆地透過文字提示詞加速創意製作(creative production)、數位孿生(digital twins)以及虛擬協作(virtual collaboration)等3D工作流程。
  3. Adobe 和 NVIDIA將共同開發生成式 AI 模型,並著重於內容歸屬和源頭(attribution and provenance),在加快全球領先創作者和營銷人員的工作流程的同時,透過 Adobe 的「內容真實性計畫」(Content Authenticity Initiative)提供適當內容歸屬以保護藝術家的權利

BioNeMo

如同NeMo和Picasso所介紹的,BioNeMo是目前是開發給生技研究人員,透過客製化訓練、部署生技領域的生成式、預測性AI 模型,快速且大規模的生成蛋白質和生物分子的結構和功能,其願景是應用在藥物研發的領域上以加速新藥物的開發。

藥物開發有三個主要階段:

  1. 探索疾病成因
  2. 設計、創造新分子(小分子、蛋白質或抗體等)
  3. 檢視這些分子的相互作用

NVIDIA認為生成式AI可以在這些流程上做出卓越的創新和轉變,

BioNeMo目前提供以下模型:

  • AlphaFold、ESMFold 、 OpenFold: 預測蛋白質3D結構(3D protein structure prediction)
  • ProtGPT:生成蛋白質(protein generation)
  • ESM1、 ESM2:預測蛋白質性質(protein property prediction)
  • MegaMolBart 、MoFlow:生成小分子(molecule generation)
  • DiffDock:分子對接(molecular docking)
Image credit: NVIDIA

Thank you and enjoy it :)

--

--