Self -Organizing Maps (SOM) dengan Kohonen pada R— Part 1
Halo Data Enthusiast …
Pada kesempatan kali ini Saya akan membahas tentang Self-Organizing Maps (SOM) pada R dan menggunakan libraray Kohonen, dengan Dataset Bunga Iris.
Apa itu SOM?
Algoritma Self Organizing Maps (SOM) merupakan suatu metode NN yang diperkenalkan oleh Professor Teuvo Kohonen pada tahun 1982. Self Organizing Map merupakan salah satu bentuk topologi dari Unsupervised Artificial Neural Network (Unsupervised ANN) dimana dalam proses pelatihannya tidak memerlukan pengawasan (target output). SOM digunakan untuk mengelompokkan (clustering) data berdasarkan karakteristik atau fitur-fitur data. (Shieh & Liao, 2012).
Dalam algoritma SOM data input berupa vektor yang terdiri dari n komponen (tuple) yang akan dikelompokkan dalam maksimum m buah kelompok (disebut vektor contoh). Output jaringan adalah kelompok yang paling dekat atau mirip dengan input yang diberikan. Ada beberapa ukuran kedekatan yang dapat dipakai. Ukuran yang sering dipakai adalah Eucledian distance yang paling minimum (Siang, 2009).
Self Organizing Maps merupakan metode terkemuka pendekatan jaringan syaraf tiruan untuk clustering, setelah competitive learning (Han & Kamber 2001). SOM berbeda dengan competitive learing yaitu syaraf dalam satu lingkungan belajar untuk mengenali bagian lingkungan dari ruang input. SOM mengenali distribusi (seperti competitive learning) dan topologi dari vektor input yang melalui proses training (Demuth & Beale 2003)
Cara Kerja SOM
Di dalam Self Organizing Maps terdapat alogritma Self Organizing Maps yang menjalankan suatu analisis cluster dengan metode Self Organizing Maps, Misalkan himpunan dari m nilai-nilai field untuk record ke-n menjadi sebuah vektor input Xn = Xn1, Xn2 , Xn3 ,L, Xnm , dan himpunan dari m bobot untuk simpul output tertentu j menjadi vektor bobot Wj = W1 j ,W2 j ,K,Wmj (Larose, 2004).
Berikut ini adalah langkah-langkah algoritma SOM (Larose 2004) :
Untuk setiap vektor x, lakukan:
- Kompetisi. Untuk setiap simpul output j, hitung nilai D(Wj , Xn ) dari fungsi jarak. Tentukan simpul pemenang J yang meminimumkan D(Wj,Xn) dari semua simpul output.
- Kooperasi. Identifikasikan semua simpul output j dalam lingkungan simpul pemenang J didefinisikan oleh lingkungan berukuran R. Untuk simpulsimpul ini, lakukan: Adaptasi. Perbaharui nilai bobot: Wij,New = Wij,Current +η(Xni − Wij,current ).
- Perbaharui learning rate (η) dan ukuran lingkungan (R) seperlunya.
- Hentikan perlakuan ketika kriteria pemberhentian dicapai.
Keterangan:
- Inisialisasi nilai bobot biasanya menggunakan nilai tengah middlepoint/midpoint) atau menggunakan nilai acak (Demuth & Beale 2003).
- Lingkungan berukuran R berisi indeks dari semua simpul-simpul yang berada dalam radius R dari simpul pemenang i*. Ni (D ) = {j, Dij ≤ R} (Demuth & Beale 2003)
Iris Dataset
Data Iris mungkin adalah basis data yang paling dikenal untuk ditemukan dalam literatur pengenalan pola. Makalah Fisher adalah karya klasik di lapangan dan sering dijadikan rujukan hingga hari ini. (See Duda & Hart, for example). Kumpulan data berisi 3 kelas masing-masing 50 contoh, di mana setiap kelas mengacu pada jenis tanaman iris. Satu kelas dipisahkan secara linear dari 2 lainnya; yang terakhir TIDAK secara linear terpisah satu sama lain.
Informasi Atribut:
- panjang sepal (sepal length) dalam cm
- lebar sepal (sepal width) dalam cm
- panjang kelopak (petal length)dalam cm
- kelopak lebar (petal width)dalam cm
- kelas:
- Iris Setosa
- Iris Versicolour
- Iris Virginica
Berdasarkan pembahasan kali ini yaitu Self-Organizing Maps (SOM), Saya akan membuat pengelompokan (clustering) pada data iris dengan menggunakan R dan library kohonen. Untuk langkah-langkahnya dapat dilihat pada artikel berikutnya: Self-Organizing Maps (SOM) dengan Kohonen pada R — Part 2
Referensi
You Tube Channel RB Fajriya Hakim: contoh SOM dengan R dan kohonen
Tugas Akhir Achmad Isya Al Fassa, 2018