Google docs 語音輸入於觀看直播、影片的即時文字辨識應用

gatesakagi
Sep 6, 2018 · 4 min read

說在前頭

  1. 目前只有PC的解決方案,筆電、手機或平板部分還在研究中
  2. 不管是聽打員還是手語翻譯員,都是「有限」的資源,從培訓到服務所花的時間跟資源,你我都很清楚那個規模,但是市場需求端這邊卻是無止境,小至網路直播,大至總統致詞、法院通譯等等,以有限的資源若要完全滿足無止境的需求,只會加速這個資源的耗損速度,對我們這些聽損族群使用者而言,不是好事。
    若能運用現有的科技來解決部分需求,讓最迫切的使用者得享有聽打員/手語翻譯員的服務,而聽打員/手語翻譯員也不用陷入無窮止境的奔波。
    雙方皆贏的局面,一直是我努力的方向,也是我的初衷 :)

說明

Google docs的PC版本,裡面有個功能叫做「語音輸入」,可以透過麥克風說話來輸入文字,運作原理是把我們的聲音錄製即時傳送出去辨識,再把辨識完成的文字送回來,所以使用時一定要有網路,且網路的速度也決定了辨識的速度,網路越慢,來往的時間差也會跟著拉大!

Google docs(PC版本)的「語音輸入」功能

你問我PC版本是甚麼意思,簡單來說,就是要用PC開啟才會有這個選項,若你用手機、平板電腦開Chrome連Google docs或抓Google docs APP,是沒有這個選項可以用。

接下來就是要處理音源輸入這部分,在PC主機背後會有三個音源孔:

麥克風孔(粉紅色環)、喇叭孔(綠色環)、音源輸入(藍色環)

我們要找一條3.5mm音源線(公對公)分別插在麥克風孔及喇叭孔

3.5mm音源線(公對公)
音源線插上麥克風孔及喇叭孔

此時,開啟Chrome,登入Google docs網頁(https://docs.google.com/),新增一個空白文件,再另開啟一個Chrome連到你想收看的影片或直播網頁,然後再把這兩個Chrome並排:

  1. 先開啟影片
  2. 再按下Google docs的語音輸入麥克風
Google docs語音輸入功能運行中的畫面

這樣子當影片播放時,聲音就會從喇叭孔輸出再輸入到麥克風孔給Google docs抓取來跑語音輸入辨識轉成文字,有沒有覺得很方便呢?

但是,當你看影片及開Google docs跑語音輸入辨識時,就不能在用PC去做別的事情(像是瀏覽FB、用Line聊天等….)這樣子會讓Google docs抓不到他要辨識的音源來源囉!

但你想要跟直播主打字互動要怎麼辦呢?別忘記你還有手機、平板或筆電可以用啊!

PC -> 負責播放影片或直播,開Google docs跑語音輸入辨識即時文字
手機、平板或筆電 -> 可以做其他事情,像是跟直播主留言互動

後續研究

若沒有PC的話,也是可以用手機或平板電腦開影片或直播,把聲音開最大;再用NB開Google docs跑語音輸入辨識成即時文字,這樣子會有以下的缺點:

  1. 環境音的干擾要小
  2. 聲音開最大,會影響到他人的作息

若不介意的話,這也不失一個解決方案。

若你有更好的想法或建議,歡迎提出來一起研究看看。

Welcome to a place where words matter. On Medium, smart voices and original ideas take center stage - with no ads in sight. Watch
Follow all the topics you care about, and we’ll deliver the best stories for you to your homepage and inbox. Explore
Get unlimited access to the best stories on Medium — and support writers while you’re at it. Just $5/month. Upgrade