Aktualizováno! Jak na kvalitní strojový přepis českých nahrávek.

Jakub Goldmann
Švejda–Goldmann: Webdesign
2 min readSep 21, 2023

Často nahráváme rozhovory s uživateli, stakeholdery a vedeme interviews. Čelíte také zdlouhavému přepisu českých nahrávek? V tomto článku vám představíme jednoduchý a efektivní způsob, jak dosáhnout kvalitního strojového přepisu vašich českých audio záznamů pomocí online nástroje Whisper.

Ačkoliv na trhu existuje mnoho nástrojů určených pro přepis anglických nahrávek, s češtinou se stále setkáváme s řadou těžkostí.

Český přepis jako na dlani

Krok za krokem: Jak na to?

Vstupní brána

Nejprve navštivte Colab Research Google, což je online testovací prostředí, které vám umožní pracovat s nástrojem Whisper.

Nastavení prostředí:

Jakmile odkaz otevřete, uvidíte prostředí podobné Jupyter Notebooku.
Podle instrukcí na stránce nainstalujte potřebné Linux skripty. (Pozor: Po zavření prohlížeče se veškeré vaše data a instalace automaticky smažou.)

Příprava vašeho audia:

Než začnete s přepisem, ujistěte se, že vaše nahrávka je ve formátu MP3. Whisper (myslím?) nepodporuje jiné formáty.

Proces přepisu:

Ve zvoleném testovacím prostředí spusťte následující příkaz:

!whisper “NÁZEV_SOUBORU.mp3” — model large-v3

(Upozornění: “NÁZEV_SOUBORU” zastupuje skutečné jméno vašeho MP3 souboru. Pro optimální výsledky doporučujeme použít model large.)

Konečný výsledek:

Po zadání příkazu vyčkejte, dokud se nahrávka úplně nepřepíše. Výsledek můžete ihned vidět v prostředí.

Závěr

Ve Švejda-Goldmann věříme v otevřenost a sdílení know-how. Pokud vás tato oblast zajímá, rádi vás přivítáme na našich školeních a mentoringových sezeních. Těšíme se na vaše postřehy, zkušenosti. Napište nám! Díky za inspiraci Martin Kopta!

--

--

Jakub Goldmann
Švejda–Goldmann: Webdesign

Co-owner and Digital Strategist at Švejda-Goldmann I Od nápadu, přes prototyp až k digitálnímu produktu I Napsal jsem knihu 📒 „75 tipů, jak si říct o web”