Penerapan Metode Regresi Data Panel dengan R
Assalamualaikum teman-teman…
Pada artikel kali ini, saya akan membahas mengenai penelitian saya waktu kerja praktek. Metode penelitian yang saya gunakan adalah regresi data panel. Yuk, kita mengenal sedikit mengenai regresi data panel.
Regresi Data Panel
Regresi Data Panel adalah gabungan antara data cross section dan data time series, dimana unit cross section yang sama diukur pada waktu yang berbeda. Maka dengan kata lain, data panel merupakan data dari beberapa individu sama yang diamati dalam kurun waktu tertentu. Jika kita memiliki T periode waktu (t =1, 2, …, T) dan N jumlah individu (i = 1, 2, …, N), maka dengan data panel akan memiliki total unit observasi sebanyak N, T. Jika jumlah unit waktu sama untuk setiap individu, maka data disebut balanced panel. Jika sebaliknya, yakni jumlah unit waktu berbeda untuk setiap individu, maka disebut unbalanced panel.
Model Regresi Data Panel
Terdapat tiga pendekatan dalam perhitungan model regresi data panel, yaitu Common Effect Models, Fixed Effect Models, dan Random Effect Models.
- Common Effect Models, merupakan pendekatan yang paling sederhana untuk mengestimasi model regresi data panel. Estimasi untuk model ini dapat dilakukan dengan menggunakan metode OLS (Ordinary Least Square).
- Fixed Effect Models (FEM), FEM diasumsikan bahwa koefisien slope bernilai konstan tapi intercept bersifat tidak konstan. Metode yang dapat dilakukan untuk estimasi model dalam FEM, yaitu metode Least Square Dummy Variable atau yang sering disebut LSDV. Dalam metode LSDV, estimasi dilakukan dengan memasukkan variabel dummy yang digunakan untuk menjelaskan nilai intersep yang berbeda-beda akibat perbedaan nilai unit.
- Random Effect Models (REM), pada FEM atau model efek tetap, perbedaan karakteristik unit dan periode waktu diakomodasikan pada intercept, sehingga intercept dapat berubah antar waktu. Sementara untuk REM atau model efek random, perbedaan karakteristik unit dan periode waktu diakomodasikan pada error atau residual dari model. Dikarenakan ada dua komponen yang berkontribusi pada pembentukan error, yakni unit dan periode waktu, maka random error dalam REM perlu diurai menjadi error gabungan dan error untuk periode waktu
Pemilihan Model Regresi Data Panel
- Uji Chow, pengujian yang dilakukan untuk mengetahui apakah metode fixed effect lebih baik digunakan daripada menggunakan metode common effect.
- Uji Hausman, pengujian yang dilakukan untuk mengetahui apakah metode random effect merupakan metode yang lebih baik untuk digunakan bila dibandingkan dengan metode fixed effect.
- Uji Breusch Pagan, pengujian dilakukan untuk mngetahui apakah terdapat efek individu/waktu (atau keduanya) di dalam panel data.
Nah, sekarang kita langsung menerapkannya menggunakan software R yuk.
Analisis Deskriptif
Data yang digunakan merupakan data sekunder yang diperoleh dari AirNav Indonesia Cabang Tanjung Pinang, yaitu data mengenai enroute charges atau biaya pelayanan jasa navigasi penerbangan jelajah. Untuk lebih jelasnya, temen-temen bisa search sendiri ya mengenai enroute charges :)
Pertama, saya melakukan analisis deskriptif untuk mengetahui gambaran dari data menggunakan Microsoft Excel.
Berdasarkan grafik di atas menunjukkan bahwa biaya enroute charges tertinggi diperoleh dari flight number GIA286 dan SJY038 dengan rute Jakarta — Tanjung Pinang sebesar Rp1.843.380,-. Hal ini dikarenakan jarak tempuh penerbangan yang cukup jauh serta berat pesawat yang cukup berat. Lalu, diikuti oleh ENC flight number LNI620 dengan rute yang sama, namun memiliki berat pesawat yang lebih rendah sebesar Rp1.787.520,00. Pada flight number WON1274 dan WON1275 merupakan tipe pesawat yang memiliki berat pesawat yang sama, hanya saja berbeda pada jarak tempuh penerbangan. Pada flight number WON1274 merupakan penerbangan dengan rute Pekanbaru — Tanjung Pinang. Sedangkan flight number WON1275 merupakan penerbangan dengan rute Batam — Tanjung Pinang. Pada flight number PKBVL merupakan penerbangan dengan rute Dabo Singkep — Pekanbaru.
Regresi Data Panel dengan R
Langkah pertama, meng-input datanya terlebih dahulu. Dalam hal ini saya menggunakan perintah “read.csv”.
#Input Data Transformasi untuk Analisis Data Panel
datapanel=read.csv("E:\\KULIAH\\Semester 5\\KP\\KP Dini\\ENC dan TNC\\Data Transformasi.csv",sep = ";")
datapanel
Sebelum melakukan regresi data panel, terlebih dahulu aktifkan packages plm.
#Regresi Data Panel
library(plm)
Kemudian, melakukan uji Chow menggunakan syntax berikut.
#Uji Chow
common=plm(ENC~FJ+FB,data=datapanel,model="pooling")
fixed=plm(ENC~FJ+FB,data=datapanel,model="within")
pooltest(common,fixed)
dan diperoleh hasil sebagai berikut.
Berdasarkan hasil uji Chow menunjukkan bahwa nilai p-value = 2,2e-16, yang berarti hipotesis nol ditolak. Artinya metode fixed effect lebih baik digunakan daripada menggunakan metode common effect.
Lalu dilakukan pengujian kembali, yaitu uji Hausman menggunakan syntax berikut.
#Uji Hausman
fixed=plm(ENC~FJ+FB,data=datapanel,model="within")
random=plm(ENC~FJ+FB,data=datapanel,model="random")
phtest(fixed,random)
dan diperoleh hasil sebagai berikut.
Berdasarkan hasil uji Hausman menunjukkan bahwa nilai p-value = 0,9495 hipotesis nol gagal ditolak. Artinya metode random effect merupakan metode yang lebih baik untuk digunakan bila dibandingkan dengan metode fixed effect.
Setelah diperoleh model yang terbaik yaitu model random effect, selanjutnya melakukan uji Breusch Pagan menggunakan syntax berikut.
#Uji Breusch Pagan
gr=plm(ENC~FJ+FB, data=datapanel,model="random")
#Efek Dua Arah
plmtest(gr, effect="twoways", type="bp")
#Efek Individu/Cross Section
plmtest(gr, effect="individual", type="bp")
#Efek Waktu/Time
plmtest(gr, effect="time", type="bp")
Berdasarkan hasil pengujian Breusch Pagan diperoleh kesimpulan bahwa pada model random effect terdapat efek dua arah. Namun, setelah diuji efek cross section dan time, hanya terdapat efek cross section. Sehingga model yang terbentuk adalah model random effect terdapat efek satu arah, yaitu efek cross section.
Asumsi Klasik
Karena model yang terbentuk adalah model random effect, maka terdapat asumsi yang harus dipenuhi, yaitu asumsi korelasi serial dan homoskedastisitas. Berikut adalah syntax untuk melakukan uji asumsi korelasi serial.
#uji autokorelasi
glc=plm(ENC~FJ+FB, data=datapanel,model=”random”,effect=”individual”)
pbgtest(glc,order=2)
dan diperoleh hasil sebagai berikut.
Berdasarkan hasil uji korelasi serial, diperoleh bahwa nilai p-value = 0,5151 yang berarti hipotesis nol gagal ditolak. Sehingga disimpulkan bahwa tidak terdapat korelasi serial pada komponen galat.
Selanjutnya, melakukan uji asumsi homoskedastisitas menggunakan syntax berikut.
#Heteroscedasticity Robust Covariance Estimator
library(lmtest)
g1=plm(ENC~FJ+FB, data=datapanel,model="random",effect="individual")
coeftest(g1,vcovHC)
summary(g1)
dan diperoleh hasil sebagai berikut.
Berdasarkan pengujian asumsi homoskedastsitas diperoleh bahwa tidak terdapat perbedaan koefisien variabel independen dalam uji t dengan matriks kovariansi. Sehingga hasil pengujian robust terhadap heteroskedastisitas matriks kovariansi terpenuhi atau asumsi bahwa struktur variance-covariance residual sama.
Pengujian Model Regresi Data Panel
Setelah pengujian asumsi telah terpenuhi, selanjutnya adalah pengujian model regresi yang telah diperoleh, yaitu uji overall dan uji parsial menggunakan syntax berikut.
summary(g1)
dan diperoleh hasil sebagai berikut.
Berdasarkan hasil pengujian overall, diperoleh bahwa nilai p-value = 2,2e-16 , yang berarti hipotesis nol ditolak. Sehingga, secara simultan variabel independen (faktor jarak dan faktor berat) berpengaruh signifikan terhadap enroute charges. Begitu juga dengan pengujian parsial yang terdapat pada tabel Coefficients menunjukkan bahwa faktor jarak dan faktor berat secara parsial berpengaruh signifikan terhadap enroute charges.
Selain itu, dapat dilihat nilai adjusted koefisien determinasi sebesar 0,99926. Artinya, variabel independen yaitu variabel faktor jarak dan faktor berat mampu menjelaskan variabel dependen yaitu enroute charges (ENC) sebesar 99%, sedangkan sisanya sebesar 0,074% dijelaskan oleh faktor lain yang tidak sebutkan dalam model.
Model Terbaik dan Interpretasi
Diperoleh model regresi terbaik sebagai berikut.
Berdasarkan persamaan model di atas, dapat diketahui variabel yang mempengaruhi ENC adalah faktor jarak terbang dan berat pesawat, dimana nilai koefisien variabel faktor jarak terbang dan berat pesawat positif. Hal ini berarti apabila variabel faktor jarak terbang dan berat pesawat naik, maka nilai ENC juga akan naik. Selain itu, dengan menganggap variabel lain konstan, setiap penambahan satu satuan pada faktor jarak terbang, maka akan meningkatkan ENC sebesar 0,134111811. Jika menganggap variabel lain konstan, setiap penambahan satu satuan pada faktor berat, maka akan meningkatkan ENC sebesar 0,01437552
Dalam Random Effect Model nilai berbeda dari setiap individu. Dalam kasus ini setiap nomor penerbangan atau flight number memiliki nilai yang berbeda-beda. Berikut adalah syntax yang digunakan untuk melihat besarnya pengaruh pada masing-masing flight number.
#Melihat seberapa besar pengaruh masing-masing cross section
ranef(g1)
Sehingga, diperoleh model pada masing-masing cross section adalah sebagai berikut.
Prediksi
Dari model yang telah diperoleh, dilakukan prediksi dan pengujian hasil prediksi menggunakan nilai SSE, MSE, dan MAPE. Diperoleh bahwa nilai MAPE sebesar 0,03%. Artinya model tersebut sangat baik dalam memprediksi nilai Y atau enroute charges (ENC).
Sekian pembahasan saya kali ini mengenai Regresi Data Panel. Terimakasih sudah berkunjung dan membaca, semoga bermanfaat :)
Wassalamualaikum Wr. Wb …
Referensi:
- Baltagi, B. (2005). Econometrics Analysis of Panel Data, (3rd ed). Chichester: John Wiley & Sons Ltd.
- Gujarati, D. (2004). Basic Econometrics (4th ed). New York: Mc Graw- Hill Companies, Inc.
- Hidayat, A. (2014, November 2). Penjelasan Metode Analisis Regresi Data Panel. Dipetik February 12, 2020, dari Statistikian.com: https://www.statistikian.com/2014/11/regresi-data-panel.html
- Nachrowi, D., & Usman, H. (2006). Pendekatan Populer dan Praktis Ekonometrika untuk Analisis Ekonomi dan Keuangan. Jakarta: Lembaga Penerbit FE UI.
- Rosadi, D. (2010). Analisis Ekonometrika & Runtun Waktu Terapan dengan R. Yogyakarta: Andi.