開啟 AI 2.0 新時代

AI Justka
AI 講講話
Published in
5 min readAug 23, 2023
Photo by Freepik on Pinterest

AI (人工智慧,Artificial Intelligence) 的歷史已經發展許久,可參考:AI 的歷史演進。 AI 技術的進步和發展,AI 已經從單一模型發展為大型模型,開始從 「AI 1.0 時代」進入 「AI 2.0 時代」。

隨著相關技術及工具的成熟和普及,AI 是具有推動人類社會進步的新興生產力,不僅帶動其他產業「AI 化」的風潮,也創造了 AI 產業化的商機。如今許多技術都可以達到「全自動智慧化」,包括:智慧倉儲、智慧農業、無人駕駛、機器人等。

什麼是 AI 2.0 時代?

「AI 2.0」是指由人工設計的電腦裝置,為了完成人類所規定的任務,通過人類設計的演算法,以及由人類直接或間接提供的大數據,經由機器深度學習形成的自主感知、認知和決策的能力。

在 「AI 1.0 時代」,主要的應用場景是單一任務的解決,例如:圖像分類、語音識別、自然語言處理等。而在 「AI 2.0 時代」,大型模型的出現為 AI 的應用帶來了更多的可能性,可以同時處理多個不同種類的任務,如:圖像和自然語言的結合等。

AI 2.0 時代的技術發展

「AI 2.0 時代」最具代表性的技術是深度學習,它可以自動學習和提取高層次的特徵,可參考: AI 如何變聰明?(四) — — 什麼是「深度學習」

深度學習需要大量的數據和計算資源,在深度學習的基礎上,發展出許多基於「大型語言模型」的 AI 技術,例如 「BERT」、「GPT」等。這些「大型語言模型」被稱為 LLM(Large Language Models),可以進行語言理解、文本生成、圖像處理等多種任務,而且效果也日漸優秀,讓人分不清是人類所做,還是 AI 所為。

在 2022 年底 OpenAI 推出的 ChatGPT 風靡全球,它可以幫你完成許多任務,替你撰寫文案、幫你將文本做重點摘要、寫學術論文、寫程式、修改你的履歷或自我介紹等等。

ChatGPT 幫忙寫英文自我介紹

2023 年推出的 GPT-4 又更加強大,給它圖像的話,它可以生成一篇文章來描述圖像的內容;在紙上隨意畫下網頁設計的草稿,GPT-4 直接幫你轉換成網頁程式語法。

GPT-4 能解析圖像內容,回答使用者的提問。(Resource: OpenAI)
手繪的網頁設計草稿(紅框處),GPT-4 將其轉換成網頁程式語法。(Resource: OpenAI 演示 GPT-4 影片)

2022 年發布的 Midjourney 是一個可以由文本生成圖像的 AI 模型,輸入你想像中圖片的關鍵字,它就會生成出符合的結果,還會一次給你多張圖片選擇。2023 年 3 月最新發布的 V5 測試版提供更多元的圖片風格及細節演算,解析度也更加清晰,生成圖片時所需要的關鍵詞也更靈活,生成出更加逼真且精確的圖像。

Midjourney 根據關鍵字生成的圖像

AI 2.0 時代面臨的挑戰

發展大型語言模型(LLM)需要巨大的運算模型,在過去半導體的進展下,還得以滿足雲端運算(cloud computing)每年所需要新增的運算量,但如今 AI 進入更高速發展的階段,晶片設計與製造是否能跟上 AI 的腳步,同時也必須考量到成本,這是「AI 2.0 時代」首要面對的課題之一。

此外,進入「AI 2.0 時代」,我們可以輕鬆利用 LLM 模型生成文本、創作文章或圖像,雖然現在眾人都驚呼於 AI 意想不到的優秀表現,但它絕對不是 100% 完美,能不能有更新的技術搭配調整準確率,是研究者們必須不斷分析實驗的任務。

--

--