你還在手動上字幕? 別再窮忙了 ! 讓Python大神幫你完成「自動上字幕」— 附贈Python程式碼範例

如果你是Youtuber、數位媒體製作人、會議記錄者、研究者、記者、訪談者、逐字稿業者通通給我照過來~!

行銷資料科學
Dec 5, 2018 · 7 min read

為什麼我們需要「自動上字幕」?

您曾經有過人工上字幕或手打逐字稿的經驗嗎? 相信您一定體會過什麼叫做「必要之惡」的痛楚,讓我們說得更白話一些,在現今的時代人工上字幕與手打逐字稿可說是「幾乎無生產力,且又耗時」的工作任務。

在我們服務的不同領域中,我們的許多合作夥伴皆有處理字幕的困境。我們都知道,這是一件耗費人工、重複、且繁雜的工作。但我們似乎卻沒有有效的方案去處理語音與文字之間的轉換。

基於這樣的市場需求,我們開始研發「自動化上字幕」的AI應用。

我們「利用機器學習,以最低成本、最高效益讓機器自動批打字幕與逐字稿」。並滿足下列市場需求:

  1. 數位媒體影音檔字幕編輯(如:Youtuber在製作影片時的字幕需求)
  2. 大型機構會議記錄效率上的提升(如:學校、公司、政府機關等會議記錄需求)
  3. 研究者訪談(碩士生、博士生、教授等)的語音與文字稿的轉換需求

所以本次我們就來分享「自動化字幕」如何在個案中發揮高價值,並且附上部份處理的程式碼讓大家玩味玩味~

案例情境

我們就以某數位媒體的影片製作個案為例,本次個案的資訊如下:

  1. 產品:行銷用之影片(包含動畫等多元商業影片)
  2. 通路:網路媒體為主
  3. 價格:人工影片字幕 NT 5,000–10,000 / 1小時
  4. 銷售:基於影片及字稿時效性,對象須節省時間,上架影片或字稿
  5. 難題:
  • 台灣觀眾普遍喜愛有上過字幕的影片,但人工上字幕相對無生產力,大部分影音市場也不希望將團隊成本損耗在字幕上。
  • 目前市場上,與字幕外包商一來一往通常就要1–3天的工作天,如遇週五時段外包,更又多浪費2天的時間。
  • 對於影片製作商來說,時間就是金錢,一支少2–3天的發表時間的影片,等於每月至少要短缺$7,000–10,000 元的營收。這更遑論每個月平均產出20支影片所造成約$140,000–200,000元短缺的營收金額。

解決方案之步驟

面對諸如難題,討論許久,最終尋覓出我們的認定的解決方案,並開始了付諸實現下述「兩大主要」步驟:

  1. 使用Python為主要語言,作為自動化上字幕的基礎語言
  2. 利用GCP(goolge cloud platform)雲端運算資源,遠端處理影音檔龐大的字幕轉換功效,快速產出影片字幕

可交付成果

最終的可交付成果主要有3項:

第一項: 影音檔 + 字幕

本個案最重要的可交付成果為「在1小時內快速處理完 有字幕的1小時影音檔」。透過多方嘗試,並遵循解決方案之步驟,我們總算完成這重大的任務!

而以下影片則為我們其中之一的範例檔案,歡迎大家到下述的youtube影片點擊觀看成效!

光看圖片不太了解?讓我們來看看影片範例吧 !

觀看影片前,提醒讀者將字幕打開

接著,將機器AI自動產生的字幕以鼠標向上移動,這樣就可以看清楚上下兩字幕囉!

如果您對我們的影片內容感興趣,可以參考一下資訊:

台科emba年年爆滿的一門word課(b+c系列)課程網址

https://hahow.in/cr/tmr-word2

觀看完影片後,大家其實可理解現今機器學習雖不能100%「取代」人類,但至少節省了人類大約75%-85%的工作時間,相對提供人類有效的解決方案!

第二項: 逐字稿(docx)與字詞改善矩陣(xlsx)

除了影音檔自動上字幕外,我們亦為本個案提供自動生成之Word及Excel檔案,供內外部人員修改做參考~!

第三項: 情緒分析與重要字詞文件

最後,我們還特別製作『情緒分析性』與『字詞重要性』文件,讓使用者與管理者能夠以重要性分析及情緒分析,判別文章中重要字詞,作為改善策略。該部分尤其受到客服產業重視,其實我們稍微換個思考模式,便就可發現『情緒分析性』與『字詞重要性』可以當作顧客的反饋,進而改善客服策略。

所以跟營收的關係?!

讓我們回過頭來思考在本次個案中,自動化上字幕與營收的關係,也就影片製作商可以得到什麼好處?

從影片製作商的角度來看,以人工作業的成本結構是$15,000,但如果採用自動化上字幕(AI聽打),且要求在60分鐘內交付成果,在以最高價格處理估算下來,可發現僅需要$3,580!

詳計成本之後我們發現:

  1. 以一個小時的影片檔案來說,自動化上「字幕」,並且進行人工更正,如果不計算時間成本之損失,每一次可以節省大約NTD$3,420元的成本支出
  2. 一個月,就可以省下接近NTD$27,000元
  3. 一年度,就可以省下接近NTD$330,000元

結語

如果相關數位媒體產業產業可以使用「自動上字幕」的作業模式,必定能夠節省大量時間,並且加以利用寶貴的時間去創造更大的價值。在資訊蓬勃發展的時代,這樣的自動化工具在數位媒體產業必然有極其可觀的市場。

不過,這一技術不該只在數位媒體業中被利用,而應該讓對字幕或逐字稿有需求者使用,不必再花費無謂的時間與精力在機器能一鍵做到的事情上。

我們在整合多方的需求後,推出了一套相關的課程,如果您正在重複繁雜的字幕工作感到困擾,或是想了解更多關於「自動化上字幕」的資訊!

我想要了解「自動化上字幕」課程:

附上Python部份程式碼:

專案實做部份程式碼,歡迎參考!

作者:鍾皓軒(臺灣行銷研究有限公司 創辦人)

歡迎加入我們的Line@獲取即時訊息!https://line.me/R/ti/p/%40cde8265r

您可能有興趣:

Marketingdatascience

行銷資料科學 — 數據驅動精準行銷。基礎概念、趨勢、方法和實戰。

行銷資料科學

Written by

Marketing data science. 台灣第一個行銷資料科學(MDS)知識部落,本粉絲專頁在探討行銷資料科學之基礎概念、趨勢、新工具和實作,讓粉絲們瞭解資料科學的行銷運用,並開啟厚植數據分析能力之契機。粉絲專頁:https://www.facebook.com/MarketingDataScienceTMR

Marketingdatascience

行銷資料科學 — 數據驅動精準行銷。基礎概念、趨勢、方法和實戰。

Welcome to a place where words matter. On Medium, smart voices and original ideas take center stage - with no ads in sight. Watch
Follow all the topics you care about, and we’ll deliver the best stories for you to your homepage and inbox. Explore
Get unlimited access to the best stories on Medium — and support writers while you’re at it. Just $5/month. Upgrade