Aktualizováno! Jak na kvalitní strojový přepis českých nahrávek.
Často nahráváme rozhovory s uživateli, stakeholdery a vedeme interviews. Čelíte také zdlouhavému přepisu českých nahrávek? V tomto článku vám představíme jednoduchý a efektivní způsob, jak dosáhnout kvalitního strojového přepisu vašich českých audio záznamů pomocí online nástroje Whisper.
Ačkoliv na trhu existuje mnoho nástrojů určených pro přepis anglických nahrávek, s češtinou se stále setkáváme s řadou těžkostí.
Krok za krokem: Jak na to?
Vstupní brána
Nejprve navštivte Colab Research Google, což je online testovací prostředí, které vám umožní pracovat s nástrojem Whisper.
Nastavení prostředí:
Jakmile odkaz otevřete, uvidíte prostředí podobné Jupyter Notebooku.
Podle instrukcí na stránce nainstalujte potřebné Linux skripty. (Pozor: Po zavření prohlížeče se veškeré vaše data a instalace automaticky smažou.)
Příprava vašeho audia:
Než začnete s přepisem, ujistěte se, že vaše nahrávka je ve formátu MP3. Whisper (myslím?) nepodporuje jiné formáty.
Proces přepisu:
Ve zvoleném testovacím prostředí spusťte následující příkaz:
!whisper “NÁZEV_SOUBORU.mp3” — model large-v3
(Upozornění: “NÁZEV_SOUBORU” zastupuje skutečné jméno vašeho MP3 souboru. Pro optimální výsledky doporučujeme použít model large.)
Konečný výsledek:
Po zadání příkazu vyčkejte, dokud se nahrávka úplně nepřepíše. Výsledek můžete ihned vidět v prostředí.
Závěr
Ve Švejda-Goldmann věříme v otevřenost a sdílení know-how. Pokud vás tato oblast zajímá, rádi vás přivítáme na našich školeních a mentoringových sezeních. Těšíme se na vaše postřehy, zkušenosti. Napište nám! Díky za inspiraci Martin Kopta!