Il Machine Learning è divertente! — Parte 6

Riconoscimento vocale con il Deep Learning

Giovanni Toschi
11 min readMar 20, 2017

Questo articolo è il secondo di una lunga serie, se lo hai già letto puoi saltare direttamente alla parte 7 o parte 8 cliccando i link diretti.

Il riconoscimento vocale sta invadendo le nostre vite. E’ ovunque, dai nostri cellulari alle console per videogiochi fino agli smartwatch. Sta persino automatizzando le nostre case. Per soli $50, è possibile comprare un Amazon Eco Dot — una scatola magica che consente di ordinare la pizza, conoscere il bollettino meteo o anche comprare sacchetti di rifiuti — semplicemente parlando ad alta voce:

Alexa, ordina una pizza grande!

L’Eco Dot è stato così popolare questa stagione Natalizia che Amazon non riesce a gestirne il magazzino!

Ma il riconoscimento vocale esiste da decenni, come mai è diventato mainstream solo negli tempi? La risposta è che finalmente il Deep Learning ha reso il riconoscimento vocale abbastanza accurato per essere usato al di fuori di ambienti strettamente controllati.

Andrew Ng ha da tempo previsto che, nel momenti in cui il riconoscimento vocale raggiungerà un accuratezza del 99%, diventerà il modo principale con cui interagiremo con i computer. L’idea è che questo piccolo divario di accuratezza del 4% differenzia un servizio fastidiosamente inaffidabile da uno…

--

--

Giovanni Toschi

#AI Director @xtendops // 10+ years of tech hustle 💪 // Built and sold an AI startup before ChatGPT was cool 😎