AI Booster - Speedy / Adobe / Roomgpt

Get More Traffic and Elevate Your Online Presence/ AI-powered audio recording and editing, all on the web / Generating dream rooms using AI for everyone.

承襲上篇,這系列文章是透過蒐集、分享我覺得有意思AI服務、相關文章、影片,期許自己能更了解這世界上正在發生什麼。

Speedy 近期獲選進入全球最大新創加速器 Y Combinator(YC)W23 梯次。Speedy 的主要客群是中小企業,協助用戶使用生成式AI產生行銷文案、部落格文章、社群Posts 並最佳化SEO、提升流量。由於中小企業的預算有限,Speedy 希望藉由AI的力量,大幅降低其行銷成本。

Image credit: YC & Speedy

Adobe 推出製作Podcast的工具,以原有的雲端服務,搭配AI的技術語音轉文字(speech-to-text),讓用戶可以順暢的錄製、後製Podcast內容。

以下為一些Sam在Demo影片中的重點:

  • 根據其大量的訓練資料,Adobe Podcast 協助在錄音前的麥克風硬體品質偵測。
Image credit: Adobe
  • 錄製後,Adobe Podcast會將音檔轉成文字檔,並能夠輕鬆地透過框選,移除內容。
Image credit: Adobe
  • 在製作做的過程搭配Adobe Cloud,能夠邀請其他用戶共同協作、錄製專案。影片中Sam 邀請其他用戶共同錄製,錄製後Sam 發現對方的錄製環境不是非常理想,開啟過濾器中的功能來優化聲音、降低雜訊。
Image credit: Adobe
Image credit: Adobe
  • 使用者可以在對話與對話間插入過場音效、背景音樂豐富聆聽體驗。
Image credit: Adobe

在Demo影片中,用戶透過語音轉文字(speech-to-text)的功能以判斷語句、斷點生成文字,目前似乎僅能刪除不必要的句子,不知道是否有搭載編輯文字,模擬用戶聲音後將其轉成語音內容,類似前幾天介紹的Play.ht中的功能,若有包含此功能,搭配Adobe本來就擁有的大量用戶、完整的雲端共同協作服務,應該是能夠成為很棒的生態系。

前兩天在Scandinavian Interior & Life的FB發文介紹,生成式AI也開始應用在室內設計,上傳空間中的某一個角度照片,並提供風格提示詞(Prompts),RoomGPT就能在幾秒鐘內提出新的風格建議。其應該是借助幾天前介紹的ControlNet的技術,添加額外條件來控制擴散模型的人工神經網路結構,將原本神經網路的權重資訊,分成鎖定副本(locked copy)和可訓練副本(trainable copy), 進一步繪製新的圖片。

儘管乍看下很新穎,也默默地為室內設計師捏把冷汗,然而,仔細點開生成圖和原圖比對後,除了覺得風格似曾相識外,會發現生成的邏輯不是非常符合實際狀況,細節也是似是而非。

比如下圖,生成的下圖將上方原圖右側的窗戶封起來不打算讓光線透進屋中,似乎沒辦法考慮圖外周圍的狀況;原先的兩個層板似乎被以為是吊燈,吊燈和餐桌上的上的物品(藝術品?)也不知所云。

Image credit: Scandinavian Interior & Life

Thank you and enjoy it :)

--

--