Report Dataset Kompetisi Data Engineering — #5 Dataset Pengklasifikasian Jenis Sampah

Ramdhanii Ram
BISA.AI
Published in
3 min readMay 29, 2020
Illustration from Undraw.co

Di tempat umum kita lebih sering melihat tempat sampah yang membedakan sampah berdasarkan organik atau tidaknya sampah tersebut, sekarang dengan bantuan Computer Vision dan Machine Learning kita bisa mengklasifikasian lebih banyak jenis sampah dengan mudah seperti tujuan para pembuat dataset ini.

Dataset yang diberi nama lengkap “Dataset Pengklasifikasian Jenis Sampah Menggunakan Metode Mean Pixel Value Of Channels (RGB)” dibuat oleh para mahasiswa dan mahasiswi Universitas Brawijaya Kota Malang yaitu:

  • Dandy Fajar Mahendra
  • Monifa Arini
  • Fatchur Rozi Al Fitrah

Penjelasan Ide & Dataset

Permasalahan sampah jika kita pikirkan lagi selalu mengarah kepada bagaimana sampah tersebut dikelola lebih lanjut. Jika dari awal sampah tidak dipisahkan sesuai jenisnya, ini akan memperumit pengelolaan sampah kedepannya. Sayangnya, ini adalah masalah yang sering kita hadapi.

Salah satu solusi yang pembuat dataset ini tawarkan adalah memodifikasi tempat sampah dengan menambahkan kamera untuk “melihat” sampah yang masuk, kemudian terhubung dengan piringan putar yang mengatur secara otomatis ke wadah mana sampah dapat dipisahkan. Di dalam kamera tersebut ditanam model AI yang menggunakan dataset ini.

Desain Prototipe dari pembuat dataset

Sekarang dalam urusan data, dataset ini mempunyai 3 label sampah yaitu: kertas, plastik dan logam; dengan masing-masing ada 100 foto mentah.

Beberapa ketentuan gambar yang harus diambil

Pengolahan Data

Data-data mentah yang diambil secara manual ini pertama-tama harus melewati preprocessing terlebih dahulu. Berdasarkan proposal dataset ini, berikut langkah-langkah preprocessing yang dilaksanakan:

  • Labelling, pemberian label gambar berdasarkan jenisnya
  • Resize, menyamakan ukuran pixel setiap gambar
  • Multiplication, memanipulasi rotasi, sudut pengambilan, background, dll untuk memperbanyak dan memperbagus data.

Tools yang digunakan untuk pembuatan features:

  • Python
  • Keras ImageGenerator
  • OpenCV

Untuk penjelasan metode dataset, langsung saja saya kutip dari proposal pembuat dataset,

Metode yang digunakan dalam pembuatan dataset ini dinamakan Mean Pixel Value of Channels. Metode ini tidak menggunakan pixel value dari tiga saluran (RGB) secara terpisah, namun kita dapat menghasilkan matriks baru yang memiliki nilai rata-rata dari ketiga saluran (RGB). Dengan begitu, jumlah fitur akan tetap sama dan pixel value dari ketiga aluran gambar (RGB) juga akan diperhitungkan.

Setelah gambar selesai melewati preprocessing, kemudian gambar tersebut dikonversi menjadi bilangan numerik matriks atau features dataset menggunakan library OpenCV. Hasilnya berupa file yang berbentuk NumPy array atau features dataset yang berisi matriks numerik RGB dari dataset yang sudah dibuat.

Haarcascade Classifier

Ini adalah salah satu metode dalam OpenCV di bidang Computer Vision yang digunakan untuk mendeteksi objek dalam sebuah gambar, termasuk dalam pembuatan dataset ini. Selengkapnya di: https://docs.opencv.org/3.4/db/d28/tutorial_cascade_classifier.html

Hasil

Hasil salah satu baris .xml Haarcascade Classifier label kertas

Dataset ini bisa kalian download di:

https://bisa.ai/dashboard/Detail_dataset?id=12

Pemanfaatan

Dataset fitur-fitur yang telah berhasil diekstrak dan diolah bisa dipakai untuk membuat model AI kemudian program pengklasifikasian jenis sampah yang akurat dan cepat.

Lebih lanjutnya model AI ini bisa dipasang di dalam kamera yang terhubung dengan Mikrokontroler seperti Raspberry Pi dan NVIDIA Jetson, yang bisa menghasilkan alat pengklasifikasian sampah yang portable.

Sekian tulisan saya mengenai laporan dataset Kompetisi Data Engineering #5 ini. Mohon maaf bila ada kesalahan kata. Terimakasih!

--

--

Ramdhanii Ram
BISA.AI
Writer for

Work stuffs & making sense interesting thoughts from my brain.