Pengertian Regresi Linear serta Keuntungan dan Kerugian

Muhammad Iqbal
Nov 1 · 3 min read

Regresi Linear

Regresi Linear adalah sebuah teknik klasik di statistika untuk mempelajari hubungan antar-variabel dan memprediksi masa depan. Walaupun tidak seakurat teknik yang lebih modern, kelebihannya adalah mudah dimengerti dan tidak mensyaratkan data harus dalam bentuk tertentu. Regresi linear mencoba untuk memodelkan hubungan antara dua variabel dengan mencocokkan persamaan linier dengan data yang diamati. Satu variabel dianggap sebagai variabel penjelas, dan yang lainnya dianggap sebagai variabel dependen. Misalnya, seorang pemodel mungkin ingin menghubungkan bobot individu dengan ketinggian mereka menggunakan model regresi linier.
Sebelum mencoba menyesuaikan model linier dengan data yang diamati, seorang modeler harus terlebih dahulu menentukan apakah ada hubungan antara variabel-variabel yang diminati. Ini tidak selalu menyiratkan bahwa satu variabel menyebabkan yang lain, tetapi bahwa ada beberapa hubungan yang signifikan antara kedua variabel. Scatterplot dapat menjadi alat yang membantu dalam menentukan kekuatan hubungan antara dua variabel. Jika tampaknya tidak ada hubungan antara variabel penjelas yang diusulkan dan variabel dependen, maka pemasangan model regresi linier ke data mungkin tidak akan memberikan model yang berguna. Ukuran numerik yang berharga dari hubungan antara dua variabel adalah koefisien korelasi, yang merupakan nilai antara -1 dan 1 yang menunjukkan kekuatan hubungan dari data yang diamati untuk dua variabel.
Garis regresi linier memiliki persamaan bentuk Y = a + bX, di mana X adalah variabel penjelas dan Y adalah variabel dependen. Kemiringan garis adalah b, dan a adalah intersep (nilai y ketika x = 0).

Keuntungan dari regresi linier

Ketika kita tahu hubungan antara variabel independen dan dependen memiliki hubungan linier, algoritme ini adalah yang terbaik untuk digunakan karena ini adalah yang paling kompleks dibandingkan dengan algoritma lain yang juga mencoba menemukan hubungan antara variabel independen dan dependen.

Kerugian dari regresi linier

Dalam kehidupan nyata, tidak ada banyak masalah di dunia yang menunjukkan hubungan yang jelas antara variabel independen dan dependen. Sebagai contoh, mari kita kembali ke contoh biaya contoh. Seringkali ada banyak faktor lain yang berperan dalam menentukan biaya. Namun, dengan itu dikatakan orang dapat berargumen bahwa kita hanya perlu menambahkan nilai-nilai yang lebih independen seperti kedekatan dengan transportasi, tingkat kejahatan dan lain-lain.
Tetapi, bahkan dengan mengatakan itu tidak ada cara kita dapat mengkonfirmasi bahwa rumah 182 meter akan harganya persis 250 juta rupiah hanya karena tidak ada yang tak terhindarkan sampai terjadi. Saya ingat menggunakan kuadrat terkecil biasa untuk laporan laboratorium tentang menentukan hubungan antara panjang pendulum dan periode ‘nya. Menggunakan OLS saya adalah 0,1 dari nilai yang dihitung menggunakan rumus. 0,1 dalam pembelajaran mesin adalah angka yang besar.

Aplikasi

Ada banyak aplikasi untuk regresi linier seperti pembelajaran mesin, estimasi tren, dan ekonomi. Algoritma pembelajaran mesin pembelajaran yang paling umum diawasi adalah regresi linier karena kesederhanaannya dan fakta bahwa ia telah ada untuk sementara waktu. Estimasi tren juga banyak menggunakan regresi linier karena bagaimanapun regresi adalah prediksi hasil dengan output kontinu. Contoh situasi di mana regresi linier dapat digunakan untuk memprediksi harga minyak atau saham di masa depan. Di bidang ekonomi, banyak hal juga diprediksi menggunakan regresi linier seperti permintaan dan penawaran tenaga kerja, pengeluaran konsumsi, dll.

Welcome to a place where words matter. On Medium, smart voices and original ideas take center stage - with no ads in sight. Watch
Follow all the topics you care about, and we’ll deliver the best stories for you to your homepage and inbox. Explore
Get unlimited access to the best stories on Medium — and support writers while you’re at it. Just $5/month. Upgrade