Fidela Juli Rahma
4 min readNov 10, 2022

Metode CNN

CNN merupakan jenis model deep learning untuk pengolahan data yang memiliki pola grid, seperti gambar, yang terinspirasi oleh organisasi korteks visual hewan dan dirancang untuk secara otomatis dan adaptif mempelajari hierarki spasial fitur, dari rendah — ke pola tingkat tinggi. CNN adalah konstruksi matematis yang biasanya terdiri dari tiga jenis lapisan (atau blok bangunan): konvolusi, penyatuan, dan lapisan yang sepenuhnya terhubung. Dua yang pertama, lapisan konvolusi dan penyatuan, melakukan ekstraksi fitur, sedangkan yang ketiga, lapisan yang sepenuhnya terhubung, memetakan fitur yang diekstraksi ke dalam hasil akhir, seperti klasifikasi. Lapisan konvolusi memainkan peran kunci dalam CNN, yang terdiri dari tumpukan operasi matematika, seperti konvolusi, jenis khusus dari operasi linier. Dalam gambar digital, nilai piksel disimpan dalam kisi dua dimensi (2D), yaitu, larik angka dan kisi kecil parameter yang disebut kernel, ekstraktor fitur yang dapat dioptimalkan, diterapkan pada setiap posisi gambar. CNN sangat efisien untuk pemrosesan pembuatan gambar, karena fitur dapat muncul di mana saja dalam gambar. Saat satu lapisan memasukkan outputnya ke lapisan berikutnya, fitur yang diekstraksi dapat secara hierarkis dan progresif menjadi lebih kompleks. Proses pengoptimalan parameter seperti kernel disebut pelatihan, yang dilakukan untuk meminimalkan perbedaan antara keluaran dan label kebenaran dasar melalui algoritme pengoptimalan yang disebut backpropagation dan penurunan gradien, antara lain ikhtisar arsitektur jaringan saraf convolutional (CNN) dan proses pelatihan.

CNN terdiri dari tumpukan beberapa blok bangunan: lapisan konvolusi, lapisan penyatuan (misalnya, kumpulan maksimum), dan lapisan yang terhubung penuh (FC). Performa model di bawah kernel dan bobot tertentu dihitung dengan fungsi kerugian melalui propagasi maju pada set data pelatihan, dan parameter yang dapat dipelajari, yaitu kernel dan bobot, diperbarui sesuai dengan nilai kerugian melalui propagasi mundur dengan algoritma optimasi penurunan gradien. ReLU , unit linier yang diperbaiki.

Komputer melihat gambar sebagai deretan angka. Matriks di sebelah kanan berisi angka antara 0 dan 255, yang masing-masing sesuai dengan kecerahan piksel pada gambar kiri.

Metode CNN dalam bisnis

Klasifikasi dan pengenalan gambar adalah bidang utama yang digunakan jaringan konvolusi. CNN mendekonstruksi gambar dan kemudian mengidentifikasi karakteristik uniknya. Untuk melakukan ini, sistem menggunakan algoritma klasifikasi pembelajaran mesin yang diawasi. Ini menyederhanakan detail dari kemampuan yang paling penting. Ini dilakukan dengan menggunakan algoritma pembelajaran mesin tanpa pengawasan. Tag gambar memberikan jenis paling mendasar yang dapat diklasifikasi oleh gambar. Tag untuk gambar adalah kata atau kombinasi kata yang menjelaskan gambar dan membantunya lebih mudah ditemukan. Google, Facebook, dan Amazon menggunakan metode ini. Ini juga salah satu aspek mendasar dari pencarian visual.

Tag dapat digunakan untuk mengidentifikasi objek dan juga analisis nada sentimen gambar. Metode pencarian visual melibatkan pencocokan gambar ke database. Selain itu, pencarian visual pencarian berbasis visual menganalisis gambar dan mencari gambar yang memiliki kredensial serupa. Misalnya, ini adalah cara Google akan menemukan variasi yang identik dengan model tetapi dalam dimensi yang berbeda. Mesin rekomendasi adalah bidang berbeda yang menggunakan klasifikasi gambar serta pengenalan objek. Misalnya, Amazon menggunakan pengenalan gambar CNN untuk menyarankan item untuk bagian “Anda mungkin juga suka”. Dasar asumsi ini adalah perilaku aktual pengguna. Item itu sendiri dicocokkan sesuai dengan dasar visual, seperti lipstik merah dan sepatu merah untuk gaun merah. Pinterest menggunakan gambar yang dikenali oleh CNN dengan metode yang berbeda. Perusahaan mengandalkan kredensial pencocokan menggunakan visual yang menghasilkan kecocokan visual langsung, ditambah dengan tag.

Perbedaan antara pengenalan gambar sederhana dan pengenalan wajah adalah dalam kompleksitas operasi, lapisan tambahan pekerjaan yang terlibat. Pertama, bentuk wajah, serta karakteristiknya, diidentifikasi. Kemudian, spesifikasi yang membentuk fitur wajah diteliti untuk menentukan kualifikasi utamanya. Bisa berupa penampilan wajah, warna kulit, warna kulit, atau bahkan adanya bekas luka, rambut, bekas luka, atau kelainan lain pada wajah. Jumlah faktor-faktor ini dimasukkan ke dalam data yang menggambarkan penampilan fisik manusia. Prosesnya melibatkan melihat sejumlah contoh individu dengan penampilan yang berbeda, misalnya, dalam hal kacamata hitam atau tidak. Di media sosial, Pengenalan wajah dapat digunakan sebagai cara untuk merampingkan metode penandaan orang yang terkadang ambigu dalam gambar. Pengenalan wajah meletakkan dasar untuk transformasi dan manipulasi masa depan untuk hiburan. Filter Facebook Messenger, serta filter Snapchat Looks, adalah contoh yang paling terkenal. Filter adalah lompatan dari tata letak dasar yang dibuat secara otomatis dari wajah dan menambahkan berbagai komponen atau bahkan efek.

Pengenalan Karakter Optik dibuat untuk pemrosesan simbol tertulis dan pencetakan. Seperti pengenalan wajah, ini adalah proses yang lebih kompleks yang menggerakkan komponen. Gambar diperiksa untuk setiap elemen yang menyerupai karakter yang tertulis dalam teks atau karakter tertentu atau umum. Setiap karakter kemudian dipecah menjadi bukti penting yang mengidentifikasinya seperti bentuk spesifik dari huruf “S” atau “Z.” Setelah itu, gambar tersebut dicocokkan dengan encoder karakter yang sesuai. Hal ini kemudian dirakit menjadi teks berdasarkan tata letak visual dari gambar input. Penandaan gambar dan deskripsi tambahan dari konten gambar untuk meningkatkan pengindeksan dan navigasi dimungkinkan oleh CNN. Sejumlah Amazon dan situs eCommerce lainnya seperti Amazon dan eBay menggunakannya untuk membuat dampak yang lebih besar. Badan hukum, seperti bank dan perusahaan asuransi, menggunakan Pengenalan Karakter Optik dari tulisan tangan.