Bounding Box Yöntemi İle Veri Etiketleme

Şafak Koç
Co-one TR
Published in
3 min readAug 4, 2021

Yapay zekanın hayatımızın her alanına entegre olduğu bir çağda yaşıyoruz. Günümüzde havacılıktan tarım ile ilgili çözümlere kadar oldukça çeşitli alanlarda yapay zeka algoritmaları kullanılıyor. Telefonunuzun yüzünüzü tanıyarak ekran kilidini açması veya sesli asistanınızla konuştuğunuzda klimanızın çalışması büyülüymüş gibi görünse de, yapay zeka sayesinde geliştirilmiş bu hizmetlerin arkasında güçlü bir takım çalışmasının ürünleri var: iyi bir algoritma ve bugünkü konumuz olan etiketlenmiş veri.

Makine öğrenmesi algoritmalarını pek çok farklı girdiyi birbirlerinden ayırmak ve ihtiyaçları olan bilgiyi tespit edebilmek üzere eğitmek için iyi bir şekilde açıklanmış verilere ihtiyaç duyarız. Bu noktada elimizdeki verilerin amacımızla ilgili, gereksiz kısımlardan ayrılmış ve uygun formatta olduğundan emin olabilmek için veri hazırlama süreçlerinden geçmiş olması büyük önem taşır. Dahası, veriler makine öğrenmesi algoritmasını eğitmek üzere uygun bir şekilde etiketlenmiş olmalıdır.

Her ne kadar çoğu kişi tarafından göz ardı edilse de doğru bir şekilde analiz edilmiş kaliteli veri, makine öğrenmesi algoritmalarını istediğimiz şekilde eğitebilmek için kilit noktadır. Üstelik veriyi analiz etmek makine öğrenmesiyle ilgili projelerin beklediğimizden daha büyük bir kısmını kapsar. Cognilytica’nın 2019’da yayınladığı rapora göre, bir yapay zeka projesine harcanan zamanın %80’i verinin hazırlanmasına harcanır, bunun yanında veri etiketlemek ise tek başına zamanın %25’ini kapsar. Buradan yola çıkarak hızlı ve doğru bir şekilde veri etiketlemenin yapay zeka projeleri için çok önemli olduğu söylenebilir.

Kaynak: Cognilytica, Data Engineering, Preparation, and Labeling for AI 2019

Video, görsel ve ses gibi farklı türde verileri etkili bir şekilde etiketlemek için pek çok yöntem kullanılabilir. Görsel etiketleme için ise kolaylığı ve hızlı kullanımıyla bounding box tekniği ön plana çıkar.

Bounding box’lar etiketlemek istediğimiz objenin kenarlarına teğet olan basit dikdörtgenler olarak tanımlanabilir. Bu metodu kullanarak görüntü üzerindeki istediğimiz objeyi sınıflandırabilir ve konumunu belirleyebiliriz, bu sayede yapay zeka algoritmasının objeyi tanımasını sağlamış oluruz. Bounding box metodunun oldukça kolay olması bounding box’ları en çok kullanılan görsel etiketleme yöntemi yapar.

Kaynak: Kaggle, veri Co-one tarafından etiketlendi (2021).

Bounding box metodu pek çok farklı alan için yapay zeka uygulamaları geliştirmek üzere ihtiyaç duyulan verileri etiketlemek için kullanılıyor. Müşterilerin alışveriş alışkanlıklarıyla ilgili bir araştırmada kullanılmak üzere bir market reyonundaki farklı ürünleri etiketlemek ile otonom araçlar için yazılım geliştirmek amacıyla bir yoldaki araç ve yayaları sınıflandırmak bounding box yönteminin kullanıldığı günlük hayattan alanlara örnek verilebilir. Her ne kadar bu yöntem sayesinde hızlı ve yüksek doğrulukta veri etiketleme sağlansa da, bazen bounding box’lar görsel etiketlemek için en iyi yöntem olmayabilir. Arka planda etiketlemek istediğimiz görselle ilişkisi olmayan çok fazla piksel bulunduğunda veya 3 boyutlu bir nesneyi etiketlemek istediğimizde bu yöntem pek kullanışlı değildir. Böyle durumlarda başka etiketleme yöntemlerini kullanmak daha iyi bir çözüm sunabilir.

Otoyolda ilerleyen araçlar, Bounding Box yöntemiyle etiketlenmiş veri örneği (Co-one, 2021).

Veri etiketleme başarılı bir yapay zeka projesi geliştirmeye giden yoldaki hayati adımlardan biridir ve bounding box yöntemi de verileri istediğiniz şekilde etiketlemenizi sağlayan harika bir yoldur. Co-one’da bounding box yöntemini kullanarak sizlere mükemmel doğruluk oranlarında ve ışık hızında çevik veri etiketleme hizmeti sunuyoruz. Siz de veri etiketlemeden kaynaklanan operasyonel yükten ve zaman kaybından sıkıldıysanız, birileri benim için çok hızlı şekilde en doğru etiketlemeleri yapsın diyorsanız, Co-one’ın sunduğu ayrıcalıklardan yararlanmak için bizimle iletişime geçin!

--

--

Şafak Koç
Co-one TR

sophomore astronautical engineering student, tries to spread the word