Lisa Lorentzen
DaNLP
Published in
2 min readNov 19, 2021

--

Vil du bidrage til, at vi kan beholde dansk som sprog?
Så er der en spændende mulighed nu!

Der er gang i en vild udvikling inden for sprogteknologi, men primært på engelsk. Vi kommer til at bruge talegenkendelse i mange funktioner i den nærmeste fremtid, det gælder alt fra at gøre kundeservice bedre og mere moderne til at hjælpe læger med at spare tid ved automatisk at omdanne deres indtalte noter til tekst. Vi vil gerne udvikle open-source værktøjer til talegenkendelse på dansk, som alle virksomheder kan benytte sig af.

Men det kan vi kun, hvis vi har tilpas meget indtalt data at træne på. Derfor er vi glade for, at non-profit organisationen Mozilla er i gang med at indsamle open-source taledata på mange forskellige sprog — heriblandt dansk.

Og det er her, at du kommer ind i billedet! Ved at læse de sætninger højt, som du får præsenteret i programmet hos Mozilla, mens der optages, kan du hjælpe med at skabe et open-source datasæt. Du kan også vælge bare at godkende de sætninger, andre har læst ind, hvis du ikke selv har lyst til at indtale sætninger.

Du kan hjælpe med den danske tale her:

https://commonvoice.mozilla.org/da/speak

.

Du kan læse mere om projektet enten ved Mozilla selv eller hos sprogteknologi.dk:

https://commonvoice.mozilla.org/da

https://sprogteknologi.dk/blog/dansk-common-voice-talekorpus

--

--