Huawei ML Kit -Genel Hatlarıyla Huawei Machine Learning Servisleri 2
Serinin birinci yazısında; Machine Learning, HMS ML Kit Text Related Services ve HMS ML Kit Language Related Services hakkında temel bilgiler aktarmaya çalışmıştım.
Başlangıç kısmını şuradan okuyabilirsiniz ;
Bu yazımda; HMS ML Kit Image Related Services ve HMS ML Kit Face and Body Related Services hakkında bilgiler paylaşacağım.
Vision & Image Related Service :
Çok zengin ve farkli görüntüler üzerinde; tanıma, algılama, sınıflandırma, ayrıştırma, bölümleme, parçalama, eğrilti düzeltme, iyileştirme, manipule etme, üzerine işlem yapma, çözünürlük iyileştirme gibi işlemlerini gerçekleştiren servislerdir.
Image Classification :
Görüntü sınıflandırma servisi, görüntü temalarını ve uygulama senaryolarını tanımlamak için görüntülerdeki öğeleri; insanlar, nesneler, ortamlar, etkinlikler veya sanat eserleri gibi sezgisel kategoriler şeklinde sınıflandırır.
Hem cihaz üzerinde hem de bulut üzerinde tanıma modlarını destekler. Cihaz üzerinde tanıma 400'den fazla yaygın resim kategorisini destekler. Bulut üzerinde tanıma 12.000 resim kategorisini destekler.
Object Detection and Tracking :
Nesne algılama ve izleme servisi, bir görüntüdeki birden çok nesneyi algılar ve izler. Böylece nesneler gerçek zamanlı olarak konumlandırılabilir ve sınıflandırılabilir. Aynı anda maksimum 8 nesne tespit edilebilir ve izlenebilir. Şuan desteklenen nesne kategorileri : ev ürünleri, moda ürünleri, yiyecek, yerler, bitkiler, yüzler ve diğerleri
Landmark Recognition :
Yer işareti tanıma servisi, bir görüntüdeki yer işaretlerinin isim, enlem ve boylam bilgilerini analiz eder ve sağlar. Şu anda 17.000'den fazla küresel yer işareti tanınabilir.
Image Segmentation :
Görüntü bölümleme servisi, bir görüntüdeki öğeleri (insan vücudu, bitki ve gökyüzü gibi) konumları ile birlikte bölümlere ayırır.
Statik görüntülerin ve dinamik kamera akışlarının bölümlendirilmesini destekler. İnce segmentasyon destekler.
Şuan desteklenen öğeler : insan vücudu, gökyüzü, bitki, yiyecek, kedi, köpek, çiçek, su, kum, bina, dağ ve diğerleri bulunur.
Çok sınıflı bölümlemenin dönüş değeri, her bir öğenin koordinat dizisidir
Product VisualSearch :
Görsel ürün arama servisi; fotoğrafı çekilen herhangi bir ürünü, önceden kurulmuş ürün görsel kitaplığında arar. Aynı veya benzer ürünlerin kimliklerini ve ilgili bilgileri döndürür. Şuan desteklenen ürünler : giyim (üstler, etekler, alt giysiler, iç çamaşırlar), çantalar, ayakkabılar, dijital ve ev aletleri, ev ürünleri, oyuncaklar, kozmetikler, aksesuarlar, yiyecekler ve diğerleri. Ayrıca, ürünleri daha iyi yönetmek için; çevrimdışı ürün içe aktarmayı, çevrimiçi ürün eklemeyi, silmeyi, değiştirmeyi, sorgulamayı ve ürün dağıtımını destekler
Image Super Resolution :
Görüntü süper çözünürlük (ISR) servisi, 1x ve 3x süper çözünürlük yetenekleri ile görseş kalitesini artırır. 1x süper çözünürlük, sıkıştırma gürültüsünü ortadan kaldırır. 3x süper çözünürlük, yalnızca sıkıştırma gürültüsünü bastırmakla kalmaz, aynı zamanda 3x büyütme yeteneği sağlar.
Document Skew Correction :
Belge çarpıklık düzeltme servisi, bir belgenin bir görüntüdeki konumunu otomatik olarak belirler ve çekim açısını belgeye bakan açıya göre ayarlar. Fotoğrafta çarpık ve yamuk şekilde duran belgeyi düzenli bir açı ile şekilde elde eder.
Text Image Super-Resolution :
Metin görüntüsü süper çözünürlük servisi, metin içeren bir görüntüyü 3 kata kadar yakınlaştırabilir. Görüntüdeki metnin tanımını önemli ölçüde iyileştirir.
Scene Detection :
Sahne algılama servisi, görüntü içeriğinin anlaşılmasına yardımcı olmak için görüntülerin senaryo içeriğini sınıflandırır. Dış mekan manzarası, iç mekanlar ve binalar gibi etiketler ekler. Desteklenen sahneler için : Scenes Supported by Scene Detection.
Face & Body Related Service :
İnsan vücudu görüntüleri üzerinde; tanıma, algılama işlemlerini gerçekleştirerek yüz, iskelet, el, canlılık gibi konularda detaylı veriler sağlayan servislerdir.
Face Detection :
Yüz algılama servisi, yüz ifadesi, yaş, cinsiyet ve giyim-aksesuar dahil olmak üzere kullanıcı yüzünün şekillerini ve özelliklerini algılar.
Yüz çevresi ile, yüz çevresi, kaşlar, gözler, burun, ağız ve kulaklar dahil olmak üzere yüz koordinatlarını doğru bir şekilde bulur. Bir yüzün eğim, sapma ve dönme açılarını belirlemek için 855'e kadar yüz çevresi noktasını destekler.
Yüz özellikleri ile; sol gözü açma olasılığı, sağ gözü açma olasılığı, gözlük takma olasılığı, cinsiyet olasılığı, şapka takma olasılığı, sakallı olma olasılığı ve yaş gibi 7 yüz özelliğini destekler.
Yüz ifadeleri ile; gülümseme, nötr, öfke, tiksinti, korku, üzüntü ve sürpriz olmak üzere 7 yüz ifadesini destekler.
Skeleton Detection :
İskelet algılama servisi, insan vücudunun baş üstü, boyun, omuzlar, dirsekler, bilekler, kalçalar, dizler ve ayak bilekleri gibi kilit noktalarını algılar ve tespit eder. Şu anda, tam gövde ve yarı gövde statik görüntü tanıma ve gerçek zamanlı kamera akışı tanıma desteklenmekte.
Liveness Detection :
Canlılık tespit servisi, kamera akışı görüntüsü ile bir yüzün gerçek bir kişinin mi yoksa yüz fotoğrafı, yüz videosu veya yüz maskesi olup olmadığını tespit eder. Sessiz canlılık algılamayı destekler.
Hand Keypoint Detection :
El kilit noktası algılama servisi, 21 adet el anahtar noktasını (parmak uçları, eklemler ve bilekler dahil) ve bu noktaların dönüş pozisyonlarını algılar. Statik görüntü algılama ve gerçek zamanlı kamera akışı algılama desteklenmekte.
Visual Common Framework :
Ortak görsel çerçeve; ML kit servisleri için kamera yakalama, önizleme, algılama, işleme, yakınlaştırma ve otomatik odaklamayı destekler.
Servislerin detaylarına ve kullanım bilgilerine başlıklardaki linkler ile ulaşabilirsiniz.
Yazının sonraki serilerinde servislerin örnek uygulamalarını ve servislerin kullanım detaylarını paylaşacağım.
Sağlılkla kalın.