Google docs 語音輸入於觀看直播、影片的即時文字辨識應用

gatesakagi
4 min readSep 6, 2018

--

說在前頭

  1. 目前只有PC的解決方案,筆電、手機或平板部分還在研究中
  2. 不管是聽打員還是手語翻譯員,都是「有限」的資源,從培訓到服務所花的時間跟資源,你我都很清楚那個規模,但是市場需求端這邊卻是無止境,小至網路直播,大至總統致詞、法院通譯等等,以有限的資源若要完全滿足無止境的需求,只會加速這個資源的耗損速度,對我們這些聽損族群使用者而言,不是好事。
    若能運用現有的科技來解決部分需求,讓最迫切的使用者得享有聽打員/手語翻譯員的服務,而聽打員/手語翻譯員也不用陷入無窮止境的奔波。
    雙方皆贏的局面,一直是我努力的方向,也是我的初衷 :)

說明

Google docs的PC版本,裡面有個功能叫做「語音輸入」,可以透過麥克風說話來輸入文字,運作原理是把我們的聲音錄製即時傳送出去辨識,再把辨識完成的文字送回來,所以使用時一定要有網路,且網路的速度也決定了辨識的速度,網路越慢,來往的時間差也會跟著拉大!

Google docs(PC版本)的「語音輸入」功能

你問我PC版本是甚麼意思,簡單來說,就是要用PC開啟才會有這個選項,若你用手機、平板電腦開Chrome連Google docs或抓Google docs APP,是沒有這個選項可以用。

接下來就是要處理音源輸入這部分,在PC主機背後會有三個音源孔:

麥克風孔(粉紅色環)、喇叭孔(綠色環)、音源輸入(藍色環)

我們要找一條3.5mm音源線(公對公)分別插在麥克風孔及喇叭孔

3.5mm音源線(公對公)
音源線插上麥克風孔及喇叭孔

此時,開啟Chrome,登入Google docs網頁(https://docs.google.com/),新增一個空白文件,再另開啟一個Chrome連到你想收看的影片或直播網頁,然後再把這兩個Chrome並排:

  1. 先開啟影片
  2. 再按下Google docs的語音輸入麥克風
Google docs語音輸入功能運行中的畫面

這樣子當影片播放時,聲音就會從喇叭孔輸出再輸入到麥克風孔給Google docs抓取來跑語音輸入辨識轉成文字,有沒有覺得很方便呢?

但是,當你看影片及開Google docs跑語音輸入辨識時,就不能在用PC去做別的事情(像是瀏覽FB、用Line聊天等….)這樣子會讓Google docs抓不到他要辨識的音源來源囉!

但你想要跟直播主打字互動要怎麼辦呢?別忘記你還有手機、平板或筆電可以用啊!

PC -> 負責播放影片或直播,開Google docs跑語音輸入辨識即時文字
手機、平板或筆電 -> 可以做其他事情,像是跟直播主留言互動

後續研究

若沒有PC的話,也是可以用手機或平板電腦開影片或直播,把聲音開最大;再用NB開Google docs跑語音輸入辨識成即時文字,這樣子會有以下的缺點:

  1. 環境音的干擾要小
  2. 聲音開最大,會影響到他人的作息

若不介意的話,這也不失一個解決方案。

若你有更好的想法或建議,歡迎提出來一起研究看看。

--

--