Google docs 語音輸入於觀看直播、影片的即時文字辨識應用
說在前頭
- 目前只有PC的解決方案,筆電、手機或平板部分還在研究中
- 不管是聽打員還是手語翻譯員,都是「有限」的資源,從培訓到服務所花的時間跟資源,你我都很清楚那個規模,但是市場需求端這邊卻是無止境,小至網路直播,大至總統致詞、法院通譯等等,以有限的資源若要完全滿足無止境的需求,只會加速這個資源的耗損速度,對我們這些聽損族群使用者而言,不是好事。
若能運用現有的科技來解決部分需求,讓最迫切的使用者得享有聽打員/手語翻譯員的服務,而聽打員/手語翻譯員也不用陷入無窮止境的奔波。
雙方皆贏的局面,一直是我努力的方向,也是我的初衷 :)
說明
Google docs的PC版本,裡面有個功能叫做「語音輸入」,可以透過麥克風說話來輸入文字,運作原理是把我們的聲音錄製即時傳送出去辨識,再把辨識完成的文字送回來,所以使用時一定要有網路,且網路的速度也決定了辨識的速度,網路越慢,來往的時間差也會跟著拉大!
你問我PC版本是甚麼意思,簡單來說,就是要用PC開啟才會有這個選項,若你用手機、平板電腦開Chrome連Google docs或抓Google docs APP,是沒有這個選項可以用。
接下來就是要處理音源輸入這部分,在PC主機背後會有三個音源孔:
我們要找一條3.5mm音源線(公對公)分別插在麥克風孔及喇叭孔
此時,開啟Chrome,登入Google docs網頁(https://docs.google.com/),新增一個空白文件,再另開啟一個Chrome連到你想收看的影片或直播網頁,然後再把這兩個Chrome並排:
- 先開啟影片
- 再按下Google docs的語音輸入麥克風
這樣子當影片播放時,聲音就會從喇叭孔輸出再輸入到麥克風孔給Google docs抓取來跑語音輸入辨識轉成文字,有沒有覺得很方便呢?
但是,當你看影片及開Google docs跑語音輸入辨識時,就不能在用PC去做別的事情(像是瀏覽FB、用Line聊天等….)這樣子會讓Google docs抓不到他要辨識的音源來源囉!
但你想要跟直播主打字互動要怎麼辦呢?別忘記你還有手機、平板或筆電可以用啊!
PC -> 負責播放影片或直播,開Google docs跑語音輸入辨識即時文字
手機、平板或筆電 -> 可以做其他事情,像是跟直播主留言互動
後續研究
若沒有PC的話,也是可以用手機或平板電腦開影片或直播,把聲音開最大;再用NB開Google docs跑語音輸入辨識成即時文字,這樣子會有以下的缺點:
- 環境音的干擾要小
- 聲音開最大,會影響到他人的作息
若不介意的話,這也不失一個解決方案。
若你有更好的想法或建議,歡迎提出來一起研究看看。