Nesne Sınıflandırma ağları veri setleri

irfan bilaloğlu
2 min readJul 9, 2020

--

Bu yazımızda nesne sınıflandırma, algılama ve segmentasyon ağlarının eğitildiği veri setlerini tanıtacağım.

Pascal VOC:

İlk büyük çaplı nesne sınıflandırma veri setlerinden biri olan Pascal (Pattern Analysis, Statistical Modelling and Computational Learning) veri seti 2012’de 20 sınıfa ait 11,530 imge içermekteydi.
2005’ten 2012 ye kadar nesne sınıflandırması üzerine yarışmalar düzenlemiştir.

host.robots.ox.ac.uk/pascal/VOC/

ImageNet:

ImageNet içerisinde 20 binden fazla kategoride 14 milyondan fazla imge bulunduran bir veri setidir. 2010’dan 2017’ye kadar ImageNet Large Scale Visual Recognition Challenge (ILSVRC) yarışmasını düzenlemiştir. CNN kullanan AlexNet 14, ILSVRC 2012’de, ikinci olan ağ ile %10.8
doğruluk farkı elde ederek birinci olmuş ve nesne sınıflandırma probleminde CNN ile derin öğrenme ağlarının kullanımını tekrar gündeme getirmiştir.
Daha sonra ILSVRC 2015’te Microsoft’un 152 katmanlı, o zamana kadar yapılmış en derin CNN ağı olan ResNet 15 birinci olmuş ve derin ağlar kullanımını gündeme getirmiştir.

Imagenet ayrıca kategoriler arasındaki anlamsal bağlantıları da tutmaktadır.

http://www.image-net.org

COCO ( Common Objects in Context ):

İçerisinde günlük nesnelere dair 80 kategoriye ait 330 bin imge barındırmaktadır. Bu imgelerin 200 bininden fazlası etiketlenmiş ve segmentasyon için işaretlenmiştir.
Ayrıca bu veri seti üzerinde nesne tanıma, algılama ve segmetasyon konularında 2015’ten günümüze yarışmalar düzenlenmektedir.

https://cocodataset.org/

KITTI Vision Benchmark Dataset:

Özellikle otonom araçlar için hazırlanmış bir veri setidir. 2012den günümüze bilgisayarlı görme üzerine yarışmalar düzenlemektedir. Sadece 2017 3 boyutlu nesne algılama veri setinde, 15 bin imge ve bu imgelere eşlik eden point cloud verisi bulunmaktadır.

http://www.cvlibs.net/datasets/kitti/

Open Images:

Yaklaşık 9 milyon resimden oluşan bir veri setidir. Resim başına ortalama olarak 8.4 nesne içerir.

Şuan 6. versiyonunda

  • 600 kategoride 15,851,536 kutu
  • 350 kategoride 2,785,498 nesne işaretleme
  • 1,466 ayrı ilişkide 3,284,282 ilişki bağlantısı
  • 507,444 ses betimleme
  • 19,957 kategoride 59,919,574 resim etiketi

içermektedir.

https://storage.googleapis.com/openimages/web/index.html

--

--