Computer Vision (Versi Gue)

Harits Abdurrohman
5 min readMar 26, 2017

--

Bismillahirrahmanirrahim

Ah udah lama ga nulis. katanya

Gue? ya gimana bingung mau nulis apa. Semoga media yang ini bisa membawa perubahan bagi pembaca maupun penulis. well, sekarang gue semester 6 di suatu PTN. Banyak cerita yang gue dapet selama 3 tahun ini. Terkhusus buat apa yang gue kejar-kejar selain deadline. Mimpi.

“Rits, mimpi lo apa?”

“Biar gue tata dulu….” Jawab gue. Untuk 5 tahun ke depan semua bakal beda. Banyak yang gue tinggal. Proses dari polos ke dewasa atau sebaliknya. Bangun pinta tubuh gue tiap dini hari.

“Ada mimpi yang harus lo kejar lagi hari ini” ucap tubuh gue seolah hari ini hari terakhir buat bangun. Ya, semangat. Menarik napas untuk membuat segar otak dan segelas air putih untuk menyegarkan raga. Pasang muka serius di depan cermin seolah lo kecewa dengan diri lo di hari sebelumnya karena tidak mencapai 1 goal. Lawan wajahnya. Kepalkan tangan. Ada hari yang akan menerjang tubuh lo 24 jam, makan yang lo suka, minum yang lo mau, dandan sesuai keinginan lo karena hari itu adalah miliki lo

========================================

Intro? oh iya hahaha sedikit buat pembaca semoga memotivasi. Pada sesi ini (terkhusus media baru berupa medium) gue mau ngejelasin sedikit tentang apa yang udah gue pelajarin di kampus (bgm: Anjaay).

Computer vision atau kalo di Google Translate artinya visi komputer adalah salah bidang ilmu komputer yang mempelajari tentang bagaimana mengambil sebuah informasi dari citra.

Bahasa mudahnya gini, kita sebagai manusia yang telah diberikan akaloleh yang Maha Kuasa tentu dapat dengan mudah mengenali sebuah objek. Seperti melihat foto paparazi mantan, hanya dengan melihat sedikit saja tentu kita tau itu sang mantan! Bagaimana tidak, karena kita sudah mengenalnya. Informasi yang sedikit langsung menjadi informasi yang utuh sehingga dapat digunakan. Tapi komputer? Ah tentunya belum bisa sebaik akal manusia. Ada training dahulu baru bisa digunakan. Otak manusia? Alhamdulillah otak mempunyai kapasitas yang luar biasa. well, lo dengan mudah mengenali sebuah pola, gambar, suara, sentuhan meski hanya sekilas.

Nah si komputer ini nih belum tentu bisa. Makanya harus kita ajarin dulu. Gimana caranya? Pada visi komputer, kita mengambil informasi yang “setengah-setengah” kemudian di olah menjadi informasi yang utuh.

Buat pembaca yang ngira ini pengolahan citra digital, menurut gue beda.

Beda!

Di visi komputer lo ngeproses sebuah citra untuk mengekstraksi informasi yang di dalamnya. Contoh lo mau tau mana bagian dari potongan citra dari citra lain.

Citra yang dicari
Citra asal

Maka lo bisa mulai dengan mengekstraksi fiturnya,

Mencocokkan citra yang di cari dengan citra asal dengan metode SIFT

Nah kalo di pengolahan citra lo tuh ngolah citra yang ada terus di kasih sebuah fungsi yang membuat citra baru. Contohnya filter di aplikasi foto lo yang biasa di pake buat ngasih efek-efek unyu menggemaskan buat foto lo. Buat jadi hitam putih atau efek-efek bokeh. Pencitraan. Kurang lebih gitu. Atau bahasa gampangnya filter.

Berbeda juga dengan komputer grafis, dimana yang lo kerjain adalah ngubah dari sebuah model menjadi sebuah citra (2-Dimensi/3-Dimensi). Di visi komputer yang lo kerjain adalah ngubah citra menjadi sebuah model. Tentunya buat di ambil informasinya. Buat apa? Biar si komputer tau ada apa aja di citra itu.

Ini juga beda!

ya sekilas begitu. Kalo ini penjelasan dari assignment gue (yang bahkan ga gue kumpul. Mohon jangan di ditiru ya pembaca).

Computer Vision adalah salah satu disiplin ilmu dalam ilmu komputer yang mempelajari tentang mengambil informasi dari sebuah citra (baik statis maupun dinamis). Computer vision berbeda dengan computer graphics. Yakni computer vision merubah dari images ke model, computer graphics merubah model menjadi image.
Tidak juga sama dengan image processing. Computer vision tentang bagaimana mesin melihat dan mengambil informasinya, sedangkan image processing ialah memperbaiki citra, mentransformasikan citra atau mengenali pola.

Yha begitu penjelasan gue. Sumber? Nanti gue taruh di bawah.

Dalam Computer Vision, terdapat 3 masalah klasik, yakni rekonstruksi, recognition, dan (re)organisasi (Malik, 2016).

Rekonstruksi adalah membangun ulang citra dari informasi di berikan menjadi sebuah objek atau membentuk sebuah model yang dapat memberikan sebuah gambaran, seperti membangun suasana dari beberapa citra yang diberikan (Inverse grapichs).

Recognition adalah pelabelan dari objek atau suana sebagai suatu kejadian atau aktivitas. Dalam recognition ini terdapat segmentasi yakni memisahkan objek yang perlu di kenali dengan latar belakang. Selain itu juga mencari berdasarkan fitur menggunakan deep learning.

Reorganisasi membantu dalam recognition maupun rekonstruksi, seperti menyimpan apa yang telah di kenali sehingga mengurangi beban saat segmentasi.

Nah jelas ga? Well untuk implementasinya banyak, antara lain OCR (Optical Character Recognition) yang ngambil informasi dari tulisan orang (untuk mengenali tulisan. Contoh: Translate tulisan dokter), citra medis, match move buat gabungin CGI dengan live action footage dari nge-track poin, atau untuk mengenali citra biometric kayak fingerprint dan masing banyak lagi.

Gitu brad, jelas kan ya? Kalau belum jelas silahkan tanya, insyaAllah kalo gue mampu gue bantu jawab, atau kalo ada yang ingin menambah atau membenarkan silahkan. Soalnya manusia tempatnya salah, lupa dan traktir (atau alasan lo tetep tegar depan mantan yang udah punya gebetan jauh lebih bahagia dari lo). Gue coba di tulisan berikutnya ngebahas tentang OpenCV dan implementasi di Python! (Mohon do’a pembaca)
Sekian dari gue.

Peace!

-Otakbeku(Maret, 2017)

Sumber:
-Szeliski, Richard. Computer Vision: Algorithms and Applications (draft). Springer, Septermber 3 2010
-Malik, Jitendra et al. The three R’s of computer vision: Recognition, reconstruction and reorganization. ScienceDirect. 2016

--

--

Harits Abdurrohman

Interest with machine learning, image processing, computer vision or data science