Analisis Biplot: Penyederhanaan Interpretasi Data Multivariat

Iqbal Hanif
Data Science Indonesia
5 min readFeb 11, 2019

Ada 4 hal penting yang bisa didapatkan dari tampilan biplot, yaitu kemiripan antar objek, keragaman peubah, korelasi antar peubah, dan nilai relatif yang dimiliki suatu objek.

Biplot merupakan salah satu dari sekian banyak metode statistika multivariat yang populer digunakan saat ini, karena mampu menyederhanakan informasi dari banyak peubah menjadi grafik dua dimensi dengan interpretasi yang mudah dipahami. Menurut Jolliffe (2002), analisis biplot adalah teknik statistika deskriptif yang disajikan secara visual guna menyajikan secara simultan n objek amatan dan p peubah dalam ruang bidang berdimensi dua, sehingga ciri-ciri peubah dan objek amatan serta posisi relatif antara objek amatan dengan peubah dapat dianalisis.

Empat Interpretasi Utama dari Biplot

Sartono dkk. (dalam Matjik dan Sumertajaya, 2011) menjelaskan ada 4 hal penting yang bisa didapatkan dari tampilan biplot, yaitu kemiripan antar objek, keragaman peubah, korelasi antar peubah, dan nilai relatif yang dimiliki suatu objek.

1. Kedekatan/kemiripan antar objek yang diamati, di mana dua objek yang memiliki karakteristik yang sama akan digambarkan sebagai dua titik yang berdekatan

2. Keragaman peubah, di mana peubah yang memiliki keragaman yang kecil digambarkan sebagai vektor pendek sedangkan peubah yang memiliki keragaman yang besar digambarkan sebagai vektor panjang.

3. Korelasi antar peubah, di mana dua peubah yang memiliki korelasi positif digambarkan sebagai dua buah garis dengan arah yang sama atau membentuk sudut yang sempit. Sebaliknya, dua peubah yang memiliki korelasi negatif digambarkan dengan arah yang berlawanan atau membentuk sudut lebar (tumpul). Jika dua peubah tidak berkorelasi, maka digambarkan dalam bentuk dua garis dengan sudut mendekati 90 derajat.

4. Nilai relatif peubah suatu objek, di mana objek yang terletak searah dengan arah vektor peubah dapat dinyatakan bahwa objek tersebut mempunyai nilai di atas rata-rata. Sebaliknya jika objek terletak berlawanan arah dari vektor peubah tersebut, maka objek tersebut memiliki nilai di bawah rata-rata.

Metode Singular Value Decomposition

Jollife (2002) menjelaskan bahwa analisis biplot didasarkan pada teknik Singular Value Decomposition (SVD). Misalkan X adalah matriks data berisikan n objek amatan dan p peubah, maka dengan teknik tersebut dapat dituliskan menjadi:

X= U L A’

di mana L adalah matriks diagonal berdimensi r×r dengan unsur diagonalnya adalah akar kuadrat akar ciri dari matriks X’X , A merupakan matriks berdimensi p×r yang tersusun dari vektor ciri yang berpadanan dengan akar ciri ke-i, dan U adalah matriks berdimensi n×r yang tersusun dari vektor-vektor hasil pembagian antara unsur matriks A dengan akar dari akar ciri ke-i dari matriks X’X.

Setelah dilakukan penguraian dengan teknik SVD, matriks X dapat difaktorkan dalam bentuk:

X = G H’

Di mana matriks G adalah matriks berdimensi n×r hasil perkalian antara matriks U dengan matriks L pangkat a, dan H’ adalah matriks berdimensi r×p hasil perkalian antara matriks matriks L pangkat 1-a dengan matriks A. Semua perhitungan diatas bisa dilakukan melalui software R dengan sintaks berikut:

Single Value Decomposition

Gabriel (dalam Matjik dan Sumertajaya, 2011) menyatakan bahwa himpunan data pada matriks X tersebut dapat tereduksi menjadi himpunan data yang terdiri dari n objek dan m unsur pertama, dan m=2 disebut sebagai biplot. Selengkapnya bisa dibaca disini

Ilustasi Analisis Biplot

Jika sudah melakukan operasi SVD, maka kita sudah bisa menampilkan grafik biplot (beserta elemen analisis penunjang) dengan menggunakan sintaks berikut:

Biplot & Additional Analysis Code

Contoh hasil analisis biplot dapat dilihat pada grafik dibawah ini. Grafik biplot tersebut memiliki total keragaman yang mampu dijelaskan sebesar 98,25 %. Dimensi pertama mampu menjelaskan keragaman data sebesar 95,39%, sedangkan dimensi kedua hanya sebesar 2,86%.

Ilustrasi Biplot

Dari segi keeratan hubungan antar peubah (korelasi), hubungan antara peubah TISX, TIGM, dan TISM adalah korelasi positif yang cukup besar, terlihat dari masing-masing vektor ketiga peubah tersebut membentuk sudut lancip. Hal yang sama juga berlaku antara peubah TIGM, FDI, dan TA, tetapi ketiga peubah tersebut memiliki korelasi yang cukup kecil terhadap peubah GDP karena membentuk sudut hampir mendekati 90 derajat.

Dari segi keragaman yang dimiliki setiap peubah, peubah TISX, TISM, TIGX, dan TIGM memiliki keragaman yang cukup besar, dibuktikan dengan panjangnya vektor yang dimiliki oleh peubah tersebut dalam grafik biplot. Sedangkan peubah GDP, FDI, dan TA memiliki keragaman yang lebih kecil karena memiliki panjang vektor yang lebih pendek, bahkan peubah FDI dan TA memiliki panjang vektor yang sangat pendek mendekati titik koordinat (0,0), menandakan ragam dari kedua peubah tersebut sangatlah kecil.

Berdasarkan kedekatan posisi antara objek dan posisi objek terhadap arah vektor setiap peubah pada grafik biplot, objek amatan dibagi kedalam empat kelompok:

1. Kelompok pertama terdiri dari CAM, LAO, MYA, PHI, VIE. Karakteristik kelompok ini adalah memiliki nilai dibawah rata-rata di semua peubah. Hal ini terlihat dari posisi objek yang berlawanan arah dengan semua vektor peubah, bahkan beberapa diantaranya (CAM, LAO dan MYA) memiliki posisi mendekati koordinat (0,0), yang artinya memiliki nilai yang sangat kecil hampir di semua peubah. Bisa dikatakan bahwa negara-negara dalam kelompok ini termasuk kategori negara miskin, karena memiliki nilai transaksi ekonomi intra-ASEAN, investasi-ASEAN, dan GDP per kapita yang sangat kecil, kecuali VIE dan PHI yang mampu memiliki nilai yang sedikit lebih baik namun masih di bawah rata-rata.

2. Kelompok kedua terdiri dari BRU. Karakteristik kelompok ini adalah memiliki nilai dibawah rata-rata di semua peubah, kecuali GDP. Hal ini terlihat dari posisi objek yang mendekati arah vektor peubah GDP. Meskipun memiliki nilai transaksi ekonomi intra-ASEAN, investasi intra-ASEAN, dan jumlah kedatangan turis intra-ASEAN dibawah rata-rata, BRU memiliki nilai GDP/kapita yang cukup tinggi, yang kemungkinan besar dihasilkan dari perdagangan diluar ASEAN.

3. Kelompok ketiga terdiri dari INA, MAS, dan THA. Karakteristik kelompok ini adalah memiliki nilai diatas rata-rata2 hampir di semua peubah, kecuali GDP. Hal ini terlihat dari posisi objek yang searah/mendekati arah vektor semua peubah kecuali peubah GDP. Objek MAS memiliki nilai TA paling besar dibandingkan objek lainnya, sedangkan INA memiliki nilai FDI paling besar dibandingkan objek lainnya. Bisa dikatakan bahwa negara dalam kelompok ini adalah negara berkembang dan mengungguli negara-negara yang berada dalam kelompok 1 dan 2.

4. Kelompok keempat terdiri dari SIN. Karakteristik kelompok ini adalah memiliki nilai diatas rata-rata untuk semua peubah, bahkan jauh mengungguli objek-objek lainnya di beberapa peubah (kecuali peubah TA dan FDI). Hal ini terlihat dari posisi objek yang jauh terpisah dengan objek-objek lainnya namun posisinya tetap mendekati arah vektor peubah, kecuali peubah TA dan FDI. Bisa dikatakan bahwa kelompok ini adalah kelompok negara maju yang jauh mengungguli negara ASEAN lainnya.

Hasil pengelompokan di atas menunjukkan bahwa Indonesia berada di kelompok ketiga. Walaupun demikian, Indonesia masih tertinggal dibandingkan dengan dua negara tersebut dari segi GDP/kapita, transaksi ekonomi intra-ASEAN, dan jumlah turis Intra-ASEAN.

(Tulisan berikut merupakan resume dari makalah penulis yang dipublikasikan di SEMNASTAT UNP 2016 yang dapat diakses disini)

REFERENSI

Jolliffe, I. T. (2002). Principal Component Analysis Second Edition, Springer-Verlag, New York.

Matjik, A.A. dan Sumertajaya, I.M. (2011). Sidik Peubah Ganda: dengan Menggunakan SAS, IPB Press, Bogor

--

--