📊

Kalkulator Regresi Linear

Analisis regresi linear sederhana dengan scatter plot SVG, koefisien determinasi R², korelasi Pearson, prediksi, dan tabel residual.

MATEMATIKA

Kalkulator regresi linear sederhana untuk siswa statistik, mahasiswa, dan peneliti. Analisis hubungan dua variabel dengan scatter plot SVG, koefisien determinasi, dan prediksi.

Empat tab: input data (x, y) dinamis, hasil regresi (ŷ = a + bx, R², r, Se, tabel residual), prediksi forward/inverse dengan confidence interval, dan scatter plot SVG interaktif dengan garis regresi dan residual visual.

Masukkan pasangan data (x, y) untuk analisis regresi linear. Minimal 3 pasangan data diperlukan.

No.Nilai X (Variabel Independen)Nilai Y (Variabel Dependen)Aksi
1
2
3
4
5
Total data: 5 pasangan (minimal 3)
Rumus Regresi Linear Sederhana
1.
Persamaan: y = a + bx
a = intercept (titik potong sumbu y), b = slope (kemiringan garis)
2.
Slope: b = (nΣxy - ΣxΣy) / (nΣx² - (Σx)²)
3.
Intercept: a = ȳ - b * x̄
4.
R²: Koefisien determinasi, menunjukkan proporsi variasi y yang dijelaskan oleh x
5.
r: Koefisien korelasi Pearson, rentang -1 sampai +1
Kalkulator ini menggunakan metode Ordinary Least Squares (OLS) untuk regresi linear sederhana. Untuk analisis statistik yang lebih kompleks, gunakan perangkat lunak seperti SPSS, R, atau Python. Interval kepercayaan menggunakan pendekatan t-distribution dengan estimasi t = 2 (~95%).

Informasi kalkulator

Cara menggunakan kalkulator ini

  1. Buka tab Input Data: tambahkan pasangan (x, y) baris per baris secara dinamis; minimal 3 pasangan untuk statistik bermakna, idealnya 10 atau lebih.
  2. Pastikan x dan y bertipe numerik dan tidak ada nilai kosong; gunakan tombol Tambah Baris dan Hapus untuk mengatur data.
  3. Pindah ke tab Hasil Regresi: kalkulator menampilkan persamaan y-topi = a + bx, koefisien determinasi R^2, koefisien korelasi r, standard error of estimate Se, dan tabel residual e_i = y_i - y-topi_i.
  4. Interpretasi R^2: 0.9 atau lebih sangat baik, 0.7-0.9 baik, 0.5-0.7 cukup, kurang dari 0.5 lemah; semakin tinggi semakin baik hubungan linear antara x dan y.
  5. Tab Prediksi: masukkan nilai x baru untuk memprediksi y, atau nilai y untuk inverse prediction (mencari x); confidence interval 95 persen ditampilkan bila n > 10.
  6. Tab Scatter Plot SVG: visualisasi data sebagai titik, garis regresi merah, dan residual sebagai garis vertikal dari titik ke garis; klik titik untuk highlight residual.

Regresi Linear Sederhana (Ordinary Least Squares)

y-topi = a + bx ; b = (n*Sigma(xy) - Sigma(x)*Sigma(y)) / (n*Sigma(x^2) - (Sigma(x))^2) ; a = (Sigma(y) - b*Sigma(x)) / n ; r = (n*Sigma(xy) - Sigma(x)*Sigma(y)) / sqrt((n*Sigma(x^2) - (Sigma(x))^2)*(n*Sigma(y^2) - (Sigma(y))^2)) ; R^2 = r^2 ; Se = sqrt(Sigma(e_i^2)/(n-2))
  • x_i, y_i = pasangan data observasi ke-i
  • y-topi_i = prediksi y dari model untuk x = x_i
  • n = jumlah pasangan data (sample size)
  • a = intercept (perpotongan dengan sumbu y bila x=0)
  • b = slope (perubahan y per satu unit x)
  • r = koefisien korelasi Pearson, rentang -1 sampai +1
  • R^2 = koefisien determinasi, persentase variansi y yang dijelaskan oleh x
  • Se = standard error of the estimate

OLS memerlukan empat asumsi (Gauss-Markov): linearitas, independensi residual, homoskedastisitas (variance konstan), dan residual normal. Bila salah satu dilanggar, hasil estimasi masih unbiased tetapi standard error bisa salah, sehingga uji hipotesis dan CI menjadi tidak akurat.

Contoh: Contoh: Hubungan Jam Belajar dengan Nilai Ujian

Diketahui:
  • Data 5 siswa: (jam belajar x, nilai ujian y)
  • Siswa A: (2, 65), B: (3, 70), C: (4, 75), D: (5, 80), E: (6, 88)
  • Cari persamaan regresi dan prediksi nilai untuk x = 7 jam
Langkah:
  1. Hitung jumlah: Sigma(x) = 2+3+4+5+6 = 20, Sigma(y) = 65+70+75+80+88 = 378, n = 5.
  2. Hitung Sigma(xy) = 2*65 + 3*70 + 4*75 + 5*80 + 6*88 = 130+210+300+400+528 = 1568.
  3. Hitung Sigma(x^2) = 4+9+16+25+36 = 90 dan Sigma(y^2) = 4225+4900+5625+6400+7744 = 28894.
  4. Hitung slope: b = (5*1568 - 20*378) / (5*90 - 20^2) = (7840 - 7560) / (450 - 400) = 280/50 = 5.6.
  5. Hitung intercept: a = (378 - 5.6*20) / 5 = (378 - 112) / 5 = 266/5 = 53.2.
  6. Persamaan: y-topi = 53.2 + 5.6x. Hitung r = (5*1568 - 20*378) / sqrt((5*90 - 400)*(5*28894 - 378^2)) = 280 / sqrt(50*1586) = 280 / 281.78 = 0.9937.
  7. R^2 = 0.9937^2 = 0.9874, sangat tinggi.
  8. Prediksi nilai untuk x = 7: y-topi = 53.2 + 5.6*7 = 53.2 + 39.2 = 92.4.

Hasil: Persamaan regresi y = 53.2 + 5.6x dengan R^2 = 0.987, artinya 98.7 persen variasi nilai dijelaskan oleh jam belajar. Prediksi nilai untuk 7 jam belajar = 92.4.

Pertanyaan yang sering diajukan

Apa beda R dan R-kuadrat?
R (atau r) adalah koefisien korelasi Pearson, bernilai -1 sampai +1, menunjukkan arah dan kekuatan hubungan linear: +1 hubungan positif sempurna, -1 negatif sempurna, 0 tidak ada hubungan linear. R^2 (R-kuadrat atau koefisien determinasi) adalah kuadrat dari r, bernilai 0 sampai 1, dan diinterpretasikan sebagai persentase variansi variabel y yang dapat dijelaskan oleh variabel x melalui model regresi. R^2 = 0.85 berarti 85 persen variasi y diterangkan oleh x.
Apakah korelasi tinggi berarti sebab-akibat?
Tidak. Korelasi hanya menunjukkan adanya hubungan statistik, bukan kausalitas. Contoh klasik: penjualan es krim berkorelasi tinggi dengan jumlah tenggelam di pantai, padahal keduanya disebabkan variabel ketiga (cuaca panas). Untuk membuktikan sebab-akibat butuh: 1) korelasi statistik, 2) urutan waktu (sebab mendahului akibat), 3) eliminasi variabel pengganggu (confounding), idealnya via eksperimen acak terkontrol (RCT). Hindari kalimat seperti 'x menyebabkan y' bila hanya punya data observasional.
Berapa minimal data untuk regresi yang valid?
Secara matematis minimal n = 3 untuk menghitung slope, intercept, dan satu derajat bebas error. Tetapi untuk inferensi statistik yang andal (uji hipotesis, CI), aturan praktis n >= 30 atau n >= 10 kali jumlah prediktor. Dengan n < 10, standard error sangat lebar dan estimasi tidak stabil. Untuk model linear sederhana penelitian akademis, target minimal n = 50; untuk prediksi yang serius n >= 100. Cek juga distribusi residual harus mendekati normal.
Apa itu residual dan kenapa penting?
Residual e_i = y_i - y-topi_i adalah selisih antara nilai aktual dan nilai prediksi. Residual penting untuk diagnostik model: 1) Plot residual vs x harus menunjukkan pola acak (tidak ada pola sistematis seperti kurva atau corong), 2) Histogram residual harus mendekati normal, 3) Residual harus independen antar observasi (tidak ada autokorelasi, terutama untuk data deret waktu). Jika asumsi dilanggar, gunakan transformasi data (log, akar), regresi robust, atau model non-linear.
Kapan regresi linear tidak cocok?
Regresi linear tidak cocok bila: 1) Hubungan x dan y jelas non-linear (kuadratik, eksponensial, logistik) - gunakan regresi non-linear atau transformasi, 2) Variabel dependen y bersifat biner (0/1) - gunakan regresi logistik, 3) Ada outlier ekstrem yang menarik garis regresi - gunakan regresi robust seperti Huber atau Theil-Sen, 4) Heteroskedastisitas berat (variance residual berubah) - gunakan weighted least squares, 5) Variabel y berupa count - gunakan Poisson regression. Selalu plot data dulu sebelum memilih model.

Terakhir diperbarui: 11 Mei 2026