Huawei ML Kit -Genel Hatlarıyla Huawei Machine Learning Servisleri 1
Makine öğrenimi Nedir? Machine Learning — ML Nedir?
ML, tükettikleri verilere göre öğrenen ya da performansı iyileştiren algoritmaları tanımlayan bir yapay zeka (AI) alt kümesidir.
Başka bir deyişle açık bir şekilde programlanmadan, eldeki verileri kullanarak yapılacak işlem sonuçlarının tahmin edilmesi ve daha doğru olmasını sağlayan algoritmalardır.
Bilgisayar oyunları ve yapay zeka alanında öncü olan Amerikan bilgisayar bilimcisi Arthur Samuel tarafından 1959‘da bir araya getirilen “makine öğrenmesi” terimi, “bilgisayarın açıkça programlanmadan öğrenme yeteneği” olarak tanımlanmaktadır.
Makine öğrenimi ( ML ) ve yapay zeka ( AI ) genellikle bir arada değerlendirilerek bazı durumlarda birbirinin yerine kullanılabiliyor, fakat aynı anlama gelmezler. Tüm ML çözümleri AI iken, tüm AI çözümleri ML olmayabilir..
ML öğrenme yöntemine göre temelde üç gruba ayrılır; Gözetimli öğrenme ( Supervised learm ), Gözetimsiz öğrenme ( Unsupervised learning ) ve Takviyeli öğrenme ( Reinforcement learning )
ML eğitimi sırasında milyarlarca veri kümesi kullanılabilir. İşlenen bu verilerle alınan tahminlerin doğruluğu hakkında geri bildirim sağlayarak algoritmanın öğrenmesi sağlanır ve geliştirilir.
Makine öğreniminde yer alan süreçlerden bazıları ve ilgili başlıklar; veri madenciliği , big data ( büyük veri ), deep learning ( derin öğrenme ), prediktif analitik , tahmini modelleme, karar ağaçları, nöral ağlar ( yapay sinir ağları) …
Gelelim Huawei’nin bu konuda uzun vadeli kanıtlanmış uzmanlığından kolayca yararlanmamıza olanak tanıyan ML altyapısı ile bize neler sağladığına;
HUAWEI ML Kit, birçok kategoride kullanımı kolay makine öğrenimi servisleri sağlayarak çok çeşitli yapay zeka (AI) uygulamaları geliştirmemize yardımcı oluyor.
HMS ML Kit ile populer 5 ana kategori üzerinden 30'dan fazla makine öğrenimi servisini kullanarak çeşitli yapay zeka (AI) uygulamaları gelişirebilirsiniz. Her geçen gün servislere bir yenisi ekleniyor ve var olanlar sürekli güncelleniyor.
HMS ML Kit tarafından sağlanan Metin, Görsel, Konuşma ve Dil, Yüz ve Vücut , Custom alanlarıyla ilgili ML servislerini kısaca inceleyelim:
Servislerin detaylarına ve kullanım bilgilerine başlıklardaki linkler ile ulaşabilirsiniz.
Text Related Services :
Farklı biçimlerde metin tanıma ve metin algılama gerçekleştiren servislerdir. Metin tanıma ile birlikte, belge tanıma, banka kartı tanıma, kimlik kartı tanıma ve genel kart tanıma hizmetlerini sağlar.
Text Recognition
Metin tanıma servisi; makbuz, kartvizit gibi belge görüntülerinden metin çıkarır.u hizmet ofis, eğitim, toplu taşıma, lojistik gibi sektörlerde yaygın olarak kullanılmaktadır
Latin Alfabesini kullanan birçok dili destekler. Cloud üzerinde yapılan analiz cihaz üzerinde yapılan analiz işlemlerinden çok daha yoğun ve yüksek doğruluk içerir.
Document Recognition
Belge tanıma servisi, metin tanıma gibi çalışır, belge görüntülerindeki paragraf gibi biçimli metni tanır ve çıkartır. Farkı , biçimli şekilde algılama gerçekleştirmesidir.
Bank Card Recognition :
Banka kartı tanıma servisi, kamera akışı ile banka kartlarını tanır ve kart numarası ve son kullanma tarihi gibi önemli bilgileri çıkartır. ( 15 derecelik açı farkı dahilinde )
General Card Recognition :
Genel kart tanıma hizmeti, metin tanıma teknolojisine dayalı evrensel bir geliştirme çerçevesi sağlar. Herhangi bir sabit formatlı karttan gerekli bilgileri çıkarmak için son işlem mantığını özelleştirmenize olanak tanır.
Şuan için deteklenen bölge ve kartlar :
Hong Kong kimlik kartı, Hong Kong-Macao-Taiwan Pasaportları, Hong Kong ve Makao’da İkamet Edenler için Anakara Seyahat İzni belgesi.
Form Recognition / Table Recognition :
Form tanıma servisi, form yapısını ( hücreleri, satırları, sütunları ve koordinatları dahil) tanımak ve ayrıştırılmış metin listeleri olarak çıkartır. Çince ve İngilizce (noktalama dahil) metin oluşturmak için AI teknolojilerini kullanır.
Text Embedding :
Metin yerleştirme servisi, eşleşen vektör değerlerini sorgulamak için Çince ve İngilizce kelimeleri veya cümleleri girmenize ve sorgu sonucuna göre daha fazla araştırma yapmanıza olanak tanır.
Diğer bir deyişle, aynı anlama sahip kelimelerin benzer bir gösterime sahip olduğu, metin için öğrenilmiş bir temsildir. Zorlu doğal dil işleme problemlerinde derin öğrenmenin temel atılımlarından biri olarak kabul edilebilecek sözcük ve belgeleri temsil etmeye yönelik bu yaklaşımdır.
Şuan desteklenen servisler; Sözlük sürüm bilgisi isteği, Word vektör API, Cümle vektör API, Kelime benzerliği API, Cümle benzerliği API, En çok benzer K kelime API, Toplu Kelime vektör API.
Bir kullanıcı, kelime ile ilgili sıcak haberleri döndürmek için haber uygulamanıza bir anahtar kelime girerek arama ve tarama verimliliğini artırabilir.
Language & Speech Related Service :
Doğal dil ML servisleri ile birçok dil üzerinde; ses tanıma, dil algılama, metinden konuşmaya çevirme, konuşmadan metne çevirme, diller arası çeviri, anlık çeviri, ses kategorisi algılama gibi birçok işlem gerçeleştirilir. Desteklenen diller için : Languages Supported by Translation
Language Detection :
Real Time Language Detection : Gerçek zamanlı dil algılama servisi, hem tek dilli, hem de çok dilli metinlerde dili algılar. Metindeki dilleri ve dil kodlarını (ISO 639–1 standardıyla uyumlu ) en yüksek güvenilirlikle analiz eder. Gerçek zamanlı dil algılama servisi şuanda 107 dili desteklemekte
On Device Language Detection : Cihaz üzerinde dil algılama servisi, servis aracılığıyla cihaz üzerine indirilen model desteğiyle gerçekleştirilir. Hem tek dilli, hem de çok dilli metinlerde dili algılar. Metindeki dilleri ve dil kodlarını (ISO 639–1 standardıyla uyumlu ) en yüksek güvenilirlikle analiz eder. Gerçek zamanlı dil algılama servisi şuanda 51 dili desteklemekte.
Text Translation :
Real Time Translation : Gerçek zamanlı çeviri , buluttaki sunucu aracılığıyla kaynak dildeki metni hedef dile çevirir. Gerçek zamanlı çeviri servisi şu anda 31 dili desteklemekte.
On Device Translation : Cihaz üzerinde çeviri, servis aracılığıyla cihaz üzerine indirilen model desteğiyle gerçekleştirilir. Herhangi bir internet bağlantısı olmadan kaynak dildeki metni hedef dile çevirir. Cihaz üzerinde çeviri servisi şu anda 21 dili desteklemekte.
Automatic Speech Recognition :
Otomatik konuşma tanıma ( ASR ) servisi, konuşmayı ( 60 saniyeden fazla olmayan ) gerçek zamanlı olarak metne dönüştürür. Şu anda İngilizce, Fransızca, Almanca, İspanyolca, İtalyanca ve Mandarin Çincesi (Çince-İngilizce iki dilli konuşma dahil) desteklenmekte.
Audio file Transcription :
Ses dosyası transkripsiyon ( AFT ) servisi , 5 saatten uzun olmayan bir ses dosyasını metne dönüştürür. ASR servisine benzer fakat daha uzun işlemler içindir. Kolay anlaşılması için metni otomatik olarak bölümlere ayırabilir. Noktalama işaretlerini çıkartabilir ve zaman damgalarıyla metin bilgileri oluşturur. Şuanda Çince ve İngilizce desteklenmektedir.
Real Time Transcription :
Gerçek zamanlı transkripsiyon servisi, 5 saatten uzun olmayan bir konuşmayı gerçek zamanlı olarak metne dönüştürür. AFT servisine benzer fakat, AFT var olan ses dosyası ile, RTT anlık ses verisi ile işlem yapar. daha uzun işlemler içindir. Oluşturulan metin noktalama işaretleri ve zaman damgaları içerir. Şu anda İngilizce, Fransızca ve Mandarin Çincesi (Çince-İngilizce iki dilli konuşma dahil) desteklenmekte.
Text to Speech :
Metin okuma ( TTS ) servisi , metin bilgilerini gerçek zamanlı olarak çevrimiçi ses çıkışına dönüştürür. Daha doğal sesler üretmek için zengin tınıları, ses ve hız seçeneklerini destekler.Derin sinir ağı sentez modunu (DNN) kullanır. Şu anda İngilizce, Fransızca, Almanca, İspanyolca, İtalyanca ve Mandarin Çincesi (Çince-İngilizce iki dilli konuşma dahil) desteklenmekte. Şuanda iki standart erkek sesi ve altı standart kadın sesi mevcut.
On Device Text to Speech :
Cihaz Üzerinde metin okuma ( TTS ) servisi , cihaz üzerine indirilen model desteğiyle metin bilgilerini ses çıkışına dönüştürür. Daha doğal sesler üretmek için zengin tınıları, ses ve hız seçeneklerini destekler. Derin sinir ağı sentez modunu (DNN) kullanır. Şu anda İngilizce, Fransızca, Almanca, İspanyolca, İtalyanca desteklenmekte. Şuanda beş standart kadın sesi mevcut.
Video Course Creator ( Beta ) :
Video kurs oluşturucu servis, eğitim yazılımlarına ve yorumlara dayalı olarak video kursları otomatik olarak oluşturur. Video oluşturma maliyetlerini azaltarak ve verimliliği artırır. Aynı zamanda altyazıların oluşturulmasını da destekler.
Sound Detection :
Ses algılama hizmeti, çevrimiçi (gerçek zamanlı kayıt) modunda ses olaylarını algılar. Şu anda aşağıdaki ses olayları desteklenmekte: kahkaha, çocuk ağlaması, horlama, hapşırma, bağırma, miyavlama, havlama, akan su (musluklar, akarsular ve okyanus dalgaları gibi), araba kornaları, kapı zili, vurma, alarm sesleri (yangın alarmı duman alarmı gibi) ve diğer alarm sesleri (itfaiye aracı alarmı, ambulans alarmı, polis arabası alarmı ve hava savunma alarmı gibi).
Visual Common Framework :
Ortak görsel çerçeve; ML kit servisleri için kamera yakalama, önizleme, algılama, işleme, yakınlaştırma ve otomatik odaklamayı destekler.
Servislerin detaylarına ve kullanım bilgilerine başlıklardaki linkler ile ulaşabilirsiniz.
Bu yazımda; kısaca Machine Learning, HMS ML Kit Text Related Services ve HMS ML Kit Language Related Services hakkında temel bilgiler aktarmaya çalıştım. Yazının devamında; HMS ML Kit Image Related Services ve HMS ML Kit Face and Body Related Service hakkında bilgiler paylaşacağım.
Devamını şuradan okuyabilirsiniz;
Yazının sonraki serilerinde servislerin örnek uygulamalarını ve servislerin kullanım detaylarını paylaşacağım.
Sağlıkla kalın.