AI Booster - Play.ht

Informula
IMU Framework Design
Feb 17, 2023

AI powered text to voice generator

Image Credits: Play.ht

承襲上篇,這系列文章是透過蒐集、分享我覺得有意思AI服務、相關文章、影片,期許自己能更了解這世界上正在發生什麼。

Play.ht 是一款以人工智慧語音產生器和聲音合成提供文字轉語音(Text to Speech)服務的線上工具。透過機器學習,Play.ht 訓練了900+種聲線、100+種語言供使用者使用在商業 ( Podcast, 互動式客服(IVR),影片語音鑲嵌、文章轉語音) 和學習 ( 語言、發音 ) 用途上。也能在產生的音檔上調整口音、語速、聲調、聲量、演講風格、客製化發音等。其中一個很酷的功能是可以讓Play.ht辨識你自己的聲音(2-3小時的音檔),接著讓其訓練後克隆自己的聲音,之後就可以使用文字轉自己語音的服務。

Image Credits: Play.ht

Play.ht的服務可以整合在各大平台,鑲嵌在視窗或網頁裡。

Image Credits: Play.ht
Image Credits: Play.ht

Play.ht 也有提供自己的API讓使用者用Python使用其服務,以下是其中一個範例:

import requests
import json

url = "https://play.ht/api/v1/convert"

payload = json.dumps({
"voice": "en-US-MichelleNeural",
"content": [
"Hello My frinedsss",
"either pass content s an array of strings , or ssml , but not both"
],
"title": "Testing public api convertion"
})
headers = {
'Authorization': 'API',
'X-User-ID': 'ID',
'Content-Type': 'application/json'
}

response = requests.request("POST", url, headers=headers, data=payload)
print(response.text)

跑完以後就可以在後台看到產生的音檔,未付費的方案是有500字和下載3次的額度。

Play.ht 的應用最直接的就是聲音輸出的工作者,比如配音員、Podcaster,過去一再NG重來的情況可以用成本最低的方式解決,修改文字稿、調整語調、音調都可以用Play.ht處理。

但令人害怕的是,以前在修圖技術盛行、成熟後假圖四竄,能想像之後會有不肖人士利用名人的聲音散步不適當、違法的訊息,即便能有認證機制或科技,但假消息散布的當下,其實影響和傷害就已經造成了,之後的澄清和制裁效果有限。

Thank you and Enjoy it :)

--

--