Nodeflux Monthly AI Digest — January 2020 Issue | e-KYC

jedi
Nodeflux
Published in
9 min readFeb 10, 2020

Halo, pembaca setia Monthly AI Digest! Di edisi awal tahun ini ini kami kembali dengan menghadirkan berbagai informasi menarik di dunia AI yang telah kami kurasi dan juga kami rangkum dalam bahasa yang mudah dimengerti.

e-KYC atau e-Know Your Customer belakangan ini cukup marak diperbincangkan — terutama pasca kasus keamanan yang melibatkan kerugian pengguna hingga miliaran rupiah. Metode ini digadang-gadang akan mampu untuk menyiasati celah keamanan yang biasa dimanfaatkan oleh oknum tak bertanggung jawab. Selain itu, eKYC juga berperan untuk menghadirkan layanan keuangan yang lebih aman dan nyaman bagi seluruh penggunanya. Adopsi eKYC juga belakangan ini terus gencar demi terlaksananya sebuah sistem layanan keuangan yang efisien dan dapat diandalkan.

Pada Nodeflux Monthly AI Digest edisi kali ini, tim kami akan mengupas lebih dalam tentang beberapa teknologi yang digunakan oleh e-KYC dalam penerapannya. Simak terus pembahasan kami di artikel ini!

Editor’s Pick

Multi-modal Face Anti-spoofing Attack Detection Challenge at CVPR2019

Dipilih oleh: Amajid Sinar Guntara
Dibuat oleh: Ajian Liu, Jun Wan, Sergio Escalera, dkk
Link paper: http://openaccess.thecvf.com/content_CVPRW_2019/papers/CFS/Liu_Multi-Modal_Face_Anti-Spoofing_Attack_Detection_Challenge_at_CVPR2019_CVPRW_2019_paper.pdf

Sistem untuk mendeteksi anti-spoofing sangat diperlukan untuk menjamin keamanan suatu sistem yang menggunakan wajah sebagai bagian dari proses otentikasi seperti eKYC. Pada tahun 2019, telah dirilis CASIA-SURF dataset, yang merupakan dataset untuk anti-spoofing attack detection. Terdiri dari 1.000 subjek dan 21.000 sampel video, dataset ini merupakan dataset anti-spoofing attack detection yang terbesar.

The Chalearn LAP Multi-modal Face Anti-spoofing Attack Detection Challenge merupakan kompetisi yang diselenggarakan untuk mengetahui metode mana yang paling baik dalam mendeteksi face-spoofing. Pada paper ini dijelaskan garis besar kompetisi, termasuk desain, protokol evaluasi, dan hasil dari kompetisi tersebut.

Desain

Dataset dibagi menjadi 3 partisi, yakni: training, validation, dan testing — dengan detail sebagai berikut:

Evaluasi

Evaluasi dilakukan menggunakan 3 metric, antara lain:

  • Attack Presentation Classification Error Rate (APCER),
  • Normal Presentation Classification Error Rate (NPCER), dan
  • Average Classification Error Rate (ACER).

Hasil

*Vivi merupakan afiliasi dengan sponsor sehingga tidak dimasukkan kedalam ranking
*Vivi merupakan afiliasi dengan sponsor sehingga tidak dimasukkan kedalam ranking

Adapun metode yang mereka gunakan adalah sebagai berikut:

Dari data di atas, tidak dapat dipungkiri bahwa ensembling merupakan teknik yang terbilang powerful untuk mendapatkan model yang baik, karena 3 tim teratas terbukti menggunakan ensembling dalam membuat model.

VisionLabs

VisionLabs terpilih sebagai pemenang dari Chalearn LAP Multi-modal Face Anti-spoofing Attack Detection Challenge. Pada model ini, mereka memanfaatkan tiga jenis gambar sekaligus, yaitu: RGB, depth, dan IR diproses oleh masing-masing stream, yang nantinya digabungkan dengan menggunakan operasi concatenation dan fully-connected layers.

Berikut adalah arsitektur yang digunakan oleh VisionLabs:

Gambar 1: Skema arsitektur yang digunakan oleh VisionLabs

Papers

Learning to Cluster Faces on an Affinity Graph

Dipilih oleh: Muhammad Rifki Kurniawan
Dibuat oleh: Lei Yang, Xiaohang Zhan, Dapeng Chen, Junjie Yan, Chen Change Loy, Dahua Lin
Link paper: https://arxiv.org/pdf/1904.02749v2.pdf
Link code: https://github.com/yl-1993/learn-to-cluster

Implementasi face recognition (pengenalan wajah) menggunakan deep learning secara supervised telah banyak diaplikasikan oleh perusahaan-perusahaan berbasis AI ke dalam solusi produknya. Namun, seringkali metode supervised yang digunakan sangat membutuhkan dataset berlabel yang sangat besar — apalagi pada aplikasi pengenalan wajah yang sudah pasti membutuhkan puluhan ribu atau bahkan ratusan ribu wajah sehingga menjadikannya berbiaya komputasi cukup besar dalam melabeli suatu dataset.

Oleh karenanya, unsupervised learning menjadi metode alternatif yang berdasarkan beberapa penelitian menunjukkan hasil yang kompetitif. Tetapi yang menjadi pertanyaan adalah bagaimana clustering dapat secara efektif diimplementasikan pada large-scale dataset dengan variasi yang kompleks seperti pada dataset wajah. Penelitian ini mencoba untuk menjawabnya dengan mengusulkan pendekatan baru yang diberi nama learning to cluster yang berbasis graph convolutional neural network.

Gambar 2: Proses deteksi dan segmentasi berbasis graph untuk clustering.

Metode ini bekerja dengan memanfaatkan keunggulan representasi menggunakan graph convolutional neural network yang sangat ekspresif untuk memodelkan pola grafis yang rumit pada dataset wajah. Secara garis besar, metode ini memformulasikan kombinasi deteksi dan segmentasi dalam pipeline-nya yang hampir sama seperti yang dilakukan Mask-RCNN yaitu dengan menciptakan proposal region, mengidentifikasi yang positif, lalu menyaringnya (refine) menggunakan mask. Oleh karena itu, masukan gambar wajah akan diekstrak fiturnya menggunakan trained CNN sehingga menghasilkan d-dimensional vector yang kemudian direpresentasikan dalam affinity graph melalui representasi setiap sampel gambar dalam super-vertex.

Untuk mendapatkan koneksi (edges), dilakukan kalkulasi similarity menggunakan cosine similarity untuk mendapatkan k-nearest neighbor pada masing-masing sampel. Dari situ, akan didapatkan elemen-elemen representasi affinity graph berupa vertices and koneksinya.

Secara keseluruhan, paper ini membuktikan bahwa metode yang diusulkan ini berhasil menunjukkan performa yang lebih baik dibandingkan metode-metode pendahulu yang berbasis clustering seperti K-Means, DBSCAN(density-based clustering algorithm), HAC (Hierarchical Agglomerative Clustering), dan Approximate Rank Order.

FeatherNets: Convolutional Neural Networks

Dipilih oleh: Amajid Sinar Guntara
Link paper: https://arxiv.org/abs/1904.09290
Dibuat oleh: Peng Zhang, Fuhao Zou, dkk

FeatherNets merupakan arsitektur yang berhasil mendapatkan juara ke-3 pada Multi-modal Face Anti-spoofing Attack Detection Challenge at CVPR 2019. Hal yang menarik dari model ini adalah selain memiliki performa yang cukup mumpuni, model ini juga terhitung ringan dan cepat. Hal ini bisa terjadi dikarenakan penggunaan backbone yang tipis dan serta streaming module yang menutupi kelemahan Global Average Pooling serta memiliki parameter yang lebih sedikit.

Berikut adalah contoh streaming module dari FeatherNets:

Streaming Module

Gambar 3: Streaming module dari FeatherNets

Bisa dikatakan streaming module adalah ekstensi dari depthwise convolution. Pada streaming module, depthwise convolution layer dengan stride lebih besar dari 1 digunakan untuk melakukan downsampling pada input, kemudian dilakukan operasi flatten sehingga membentuk feature vector yang memiliki dimensi 1.

News

AI Fake Face Website Launched

Dipilih oleh: Fajar Luhung Parasdyo
Link berita: https://www.bbc.com/news/technology-47296481

Peneliti dari NVIDIA telah membuat sebuah website yang dapat menghasilkan wajah palsu menggunakan Artificial Intelligence (AI). Website ini dapat diakses pada alamat thispersondoesnotexist.com.

Setiap kali kita memuat ulang halaman pada website tersebut, maka akan ditampilkan wajah baru. Gambar wajah palsu yang dihasilkan dibuat dengan tingkat kemiripan yang tinggi — yang sangat mirip dengan foto wajah asli. Peneliti dari NVIDIA menggunakan Adversarial AI untuk melakukan hal tersebut. Bahkan, banyak dari pengunjung website tersebut yang terkejut dengan hasil gambar palsu yang sangat mirip dengan wajah asli — meskipun ada beberapa gambar yang terlihat “artifisial”.

Intel Examines Whether AI Can Recognise Faces Using Thermal Imaging

Dipilih oleh: Fajar Luhung Parasdyo
Link berita:
https://artificialintelligence-news.com/2020/01/10/intel-examines-ai-recognise-faces-thermal-imaging/

Peneliti dari Intel AI telah menerbitkan sebuah penelitian untuk mengetahui apakah AI dapat mengenali wajah orang menggunakan gambar termal. Mereka melakukan eksperimen menggunakan dataset SC3000-DB dan IRIS. Model yang dilatih bekerja dengan baik dalam membedakan antar sukarelawan dengan mengekstraksi fitur wajah mereka. Akurasi 99,5 % didapatkan pada dataset SC3000-DB dan 82,14% untuk IRIS.

Alasan gambar termal digunakan adalah untuk melindungi privasi, karena mengaburkan detail identifikasi pribadi seperti warna mata. Di beberapa tempat, seperti fasilitas medis, seringkali wajib untuk menggunakan gambar yang mengaburkan detail tersebut. Peneliti dari Intel AI membuktikan bahwa model AI yang diciptakan tetap memungkinkan untuk bisa mengenali seseorang hanya dengan menggunakan gambar termal, tanpa harus menggunakan detail identifikasi pribadi.

Tutorials

Liveness Detection with OpenCV

Dipilih oleh: Amajid Sinar Guntara
Link tutorial: https://www.pyimagesearch.com/2019/03/11/liveness-detection-with-opencv/

Jutaan orang tidak menyadari bahwa identitas mereka bisa dibajak oleh orang lain dengan cara menggunakan foto korban apabila sistem tersebut menggunakan wajah sebagai salah satu proses otentikasi.

Dalam dunia computer vision, kasus tersebut dinamakan face-spoofing dan task untuk mendeteksi hal tersebut dinamakan Anti-Face Spoofing Detection. Secara garis besar, terdapat dua langkah dalam mendeteksi face-spoofing:

1. Face Detection, yang merupakan proses penentuan dimana lokasi wajah itu berada, dan

2. Anti-Face Spoofing Detection, yang bisa menentukan apakah wajah yang dideteksi pada tahap sebelumnya merupakan wajah asli atau bukan.

Pada tutorial ini, Adrian Rosebrock mendemonstrasikan bagaimana membuat Anti-Face Spoofing Detection dengan menggunakan arsitektur CNN sederhana yang bernama LivelinessNet. Di bawah ini adalah contoh arsitektur dari LivenessNet.

Gambar 4: Skema arsitektur LivenessNet

Adapun dataset yang digunakan merupakan dataset yang dibuat oleh beliau menggunakan kamera iPhone. Dari video yang diambil oleh Adrian, Terdapat 161 gambar Real dan 151 gambar Fake sebagai dataset.

OpenCV OCR and text recognition with Tesseract

Dipilih oleh: Amajid Sinar Guntara
Link tutorial: https://www.pyimagesearch.com/2018/09/17/opencv-ocr-and-text-recognition-with-tesseract/

Digitalisasi dokumen merupakan salah satu masalah yang cukup pelik. Misalnya, pada form yang ditulis tangan pada akhirnya harus direkap ke dalam sebuah file dokumen. Pada umumnya proses ini dilakukan secara manual. Karena itu, proses ini membutuhkan tenaga dan resource yang tidak sedikit. Optical Character Recognition atau OCR merupakan task di computer vision yang menjawab masalah tersebut. Dengan menggunakan OCR, tiap karakter yang ada di dalam gambar tersebut bisa dikenali sehingga proses digitalisasi dapat dipercepat.

Tesseract merupakan salah satu project open source OCR yang paling terkenal. Pada tutorial ini, Adrian Rosebrock memperlihatkan pengaplikasian OCR menggunakan Tesseractv4

Tesseractv4 sendiri merupakan rilis termutakhir yang sudah menggunakan deep learning, sehingga lebih robust terhadap noise.

Secara garis besar, terdapat 2 proses untuk mendapatkan teks yang diinginkan, yaitu

  1. Menentukan area/region of interest (ROI) dari teks menggunakan OpenCV EAST
  2. Ekstraksi teks menggunakan Tesseract
Gambar 5: Skema dari OpenCV OCR

Miscellaneous AI

Bangladesh enforces e-KYC guidelines for financial institutions

Dipilih oleh: John Patrick
Sumber: https://www.biometricupdate.com/202001/bangladesh-enforces-e-kyc-guidelines-for-financial-institutions

Dalam upayanya untuk menghadirkan layanan perbankan yang lebih aman dan nyaman, pemerintah Bangladesh lewat Bangladesh Financial Intelligence Unit (BFIU) memperkenalkan penggunaan panduan e-KYC di kalangan institusi keuangan. Diproyeksikan hingga akhir 2020, sosialisasi panduan e-KYC ini akan merambah ke seluruh lembaga keuangan, termasuk: perbankan, lembaga keuangan non-perbankan, perusahaan asuransi, pasar modal, layanan keuangan mobile dan digital, serta perusahaan lain di bawah pengawasan Bank Bangladesh, harus mengikuti panduan penggunaan e-KYC ini.

Dengan menerapkan solusi seperti e-KYC, masyarakat dimungkinkan untuk mengakses layanan keuangan yang lebih beragam. Selain itu, harapannya dengan implementasi e-KYC, bisnis juga dapat menekan biaya operasional serta mempercepat perluasan akses keuangan.

The Secretive Company That Might End Privacy as We Know It

Dipilih oleh: John Patrick
Sumber: https://www.nytimes.com/2020/01/18/technology/clearview-privacy-facial-recognition.html

Belum lama ini, jagat maya digemparkan oleh seseorang yang bernama Hoan Thon-that. Ia menyatakan bahwa ia memiliki sebuah aplikasi yang telah digunakan oleh ratusan lembaga penegak hukum di Amerika Serikat dalam melakukan profiling. Aplikasi yang bernama ClearView AI ini diklaim mampu untuk mencocokkan data wajah dengan 3 miliar foto wajah dari seluruh dunia.

Klaim tersebut memunculkan kekhawatiran terhadap penggunaan data wajah yang diambil dari internet, karena selain scraping foto dari media sosial memang melanggar ketentuan pengguna, Thon-that juga telah beberapa kali berulah di masa lalu — seperti lewat ViddyHo, sebuah website yang sengaja dibuatnya untuk melakukan phishing.

Demikian pembahasan kami terkait teknologi yang mendukung terlaksananya e-KYC. Harapannya dengan adanya teknologi seperti FR dan Optical Character Recognition (OCR), proses e-KYC dapat menjadi lebih mudah, aman, dan nyaman — baik bagi pengguna maupun bagi perusahaan.

Simak terus Nodeflux Monthly AI Digest untuk informasi terbaru seputar industri AI dan perkembangannya!

--

--