你還在手動上字幕? 別再窮忙了 ! 讓Python大神幫你完成「自動上字幕」— 附贈Python程式碼範例

如果你是Youtuber、數位媒體製作人、會議記錄者、研究者、記者、訪談者、逐字稿業者通通給我照過來~!

行銷資料科學
Marketingdatascience
7 min readDec 5, 2018

--

為什麼我們需要「自動上字幕」?

您曾經有過人工上字幕或手打逐字稿的經驗嗎? 相信您一定體會過什麼叫做「必要之惡」的痛楚,讓我們說得更白話一些,在現今的時代人工上字幕與手打逐字稿可說是「幾乎無生產力,且又耗時」的工作任務。

在我們服務的不同領域中,我們的許多合作夥伴皆有處理字幕的困境。我們都知道,這是一件耗費人工、重複、且繁雜的工作。但我們似乎卻沒有有效的方案去處理語音與文字之間的轉換。

基於這樣的市場需求,我們開始研發「自動化上字幕」的AI應用。

我們「利用機器學習,以最低成本、最高效益讓機器自動批打字幕與逐字稿」。並滿足下列市場需求:

  1. 數位媒體影音檔字幕編輯(如:Youtuber在製作影片時的字幕需求)
  2. 大型機構會議記錄效率上的提升(如:學校、公司、政府機關等會議記錄需求)
  3. 研究者訪談(碩士生、博士生、教授等)的語音與文字稿的轉換需求

所以本次我們就來分享「自動化字幕」如何在個案中發揮高價值,並且附上部份處理的程式碼讓大家玩味玩味~

案例情境

我們就以某數位媒體的影片製作個案為例,本次個案的資訊如下:

  1. 產品:行銷用之影片(包含動畫等多元商業影片)
  2. 通路:網路媒體為主
  3. 價格:人工影片字幕 NT 5,000–10,000 / 1小時
  4. 銷售:基於影片及字稿時效性,對象須節省時間,上架影片或字稿
  5. 難題:
  • 台灣觀眾普遍喜愛有上過字幕的影片,但人工上字幕相對無生產力,大部分影音市場也不希望將團隊成本損耗在字幕上。
  • 目前市場上,與字幕外包商一來一往通常就要1–3天的工作天,如遇週五時段外包,更又多浪費2天的時間。
  • 對於影片製作商來說,時間就是金錢,一支少2–3天的發表時間的影片,等於每月至少要短缺$7,000–10,000 元的營收。這更遑論每個月平均產出20支影片所造成約$140,000–200,000元短缺的營收金額。

解決方案之步驟

面對諸如難題,討論許久,最終尋覓出我們的認定的解決方案,並開始了付諸實現下述「兩大主要」步驟:

  1. 使用Python為主要語言,作為自動化上字幕的基礎語言
  2. 利用GCP(goolge cloud platform)雲端運算資源,遠端處理影音檔龐大的字幕轉換功效,快速產出影片字幕

可交付成果

最終的可交付成果主要有3項:

第一項: 影音檔 + 字幕

本個案最重要的可交付成果為「在1小時內快速處理完 有字幕的1小時影音檔」。透過多方嘗試,並遵循解決方案之步驟,我們總算完成這重大的任務!

而以下影片則為我們其中之一的範例檔案,歡迎大家到下述的youtube影片點擊觀看成效!

讀者可很清楚看到機器AI自動產生的字幕與人工產生相差無幾,僅差一些時序上及斷字上的優化

光看圖片不太了解?讓我們來看看影片範例吧 !

觀看影片前,提醒讀者將字幕打開

接著,將機器AI自動產生的字幕以鼠標向上移動,這樣就可以看清楚上下兩字幕囉!

影音檔AI自動上字幕demo

如果您對我們的影片內容感興趣,可以參考一下資訊:

台科emba年年爆滿的一門word課(b+c系列)課程網址

https://hahow.in/cr/tmr-word2

觀看完影片後,大家其實可理解現今機器學習雖不能100%「取代」人類,但至少節省了人類大約75%-85%的工作時間,相對提供人類有效的解決方案!

第二項: 逐字稿(docx)與字詞改善矩陣(xlsx)

除了影音檔自動上字幕外,我們亦為本個案提供自動生成之Word及Excel檔案,供內外部人員修改做參考~!

第三項: 情緒分析與重要字詞文件

最後,我們還特別製作『情緒分析性』與『字詞重要性』文件,讓使用者與管理者能夠以重要性分析及情緒分析,判別文章中重要字詞,作為改善策略。該部分尤其受到客服產業重視,其實我們稍微換個思考模式,便就可發現『情緒分析性』與『字詞重要性』可以當作顧客的反饋,進而改善客服策略。

所以跟營收的關係?!

讓我們回過頭來思考在本次個案中,自動化上字幕與營收的關係,也就影片製作商可以得到什麼好處?

從影片製作商的角度來看,以人工作業的成本結構是$15,000,但如果採用自動化上字幕(AI聽打),且要求在60分鐘內交付成果,在以最高價格處理估算下來,可發現僅需要$3,580!

詳計成本之後我們發現:

  1. 以一個小時的影片檔案來說,自動化上「字幕」,並且進行人工更正,如果不計算時間成本之損失,每一次可以節省大約NTD$3,420元的成本支出
  2. 一個月,就可以省下接近NTD$27,000元
  3. 一年度,就可以省下接近NTD$330,000元

結語

如果相關數位媒體產業產業可以使用「自動上字幕」的作業模式,必定能夠節省大量時間,並且加以利用寶貴的時間去創造更大的價值。在資訊蓬勃發展的時代,這樣的自動化工具在數位媒體產業必然有極其可觀的市場。

不過,這一技術不該只在數位媒體業中被利用,而應該讓對字幕或逐字稿有需求者使用,不必再花費無謂的時間與精力在機器能一鍵做到的事情上。

我們在整合多方的需求後,推出了一套相關的課程,如果您正在重複繁雜的字幕工作感到困擾,或是想了解更多關於「自動化上字幕」的資訊!

我想要了解「自動化上字幕」課程:

附上Python部份程式碼:

專案實做部份程式碼,歡迎參考!

作者:鍾皓軒(臺灣行銷研究有限公司 創辦人)

歡迎加入我們的Line@獲取即時訊息!https://line.me/R/ti/p/%40cde8265r

您可能有興趣:

--

--

行銷資料科學
Marketingdatascience

Marketing data science. 台灣第一個行銷資料科學(MDS)知識部落,本粉絲專頁在探討行銷資料科學之基礎概念、趨勢、新工具和實作,讓粉絲們瞭解資料科學的行銷運用,並開啟厚植數據分析能力之契機。粉絲專頁:https://www.facebook.com/MarketingDataScienceTMR