Member-only story
Python ile Ses Tanıma Uygulaması Oluşturma
Python ile ses dosyalarınızı ve konuşmalarınızı metne dökün.
Speech Recognition Nedir ?
Konuşma ya da ses tanıma olarak geçer. Ses sinyallerinin örneklenerek yapay sinir ağları, makine öğrenmesi gibi metodlarla anlamlı hale getirilmesini kapsar.
Aslında bu uygulamaları iyi biliyoruz. Apple Siri, Google Asistan, Amazon Alexa gibi uygulamalar bir çoğumuzun telefonunda mevcut. Bu uygulamalar tabi ki çok ileride ve arka planlarında ciddi bir mühendislik var. Uygulamalarında ses sinyallerinin anlamlı hale getirilmesinin yanında NLP -Natural Language Processing (Doğal Dil İşleme) algoritmaları da kullanılıyor.
Speech to Text yani konuşmanın metne dönüştürülmesi işlemi ise sesli asistan oluşturulması için ilk adım. Yani önce uygulamanın konuştuklarımızı anlamasını bekleriz değil mi ? Anladığı sesleri ise motoruna metin olarak yollayabilirse bu ses verisini işlemedeki ilk adım aşılmış olur. Bu yazımızda Python üzerinden ve bir takım kütüphanelerden yararlanarak iki uygulama gerçekleştireceğiz ve speech to text kısmına odaklanacağız.
1.Uygulama — Ses Dosyasını Metne Dönüştürme
Bu uygulamada ses dosyalarını metne dönüştürmeye çalışacağız. Ses dosyalarını metne dönüştürmek özellikle veri biliminin konularından…