Regresi Linear Sederhana dalam R (Pengaruh Bakat terhadap Keahlian Bermain Bulutangkis)
31 January 2022 | Tags: regresi linear sederhana, regresi linear sederhana Bakat Keahlian Bulutangkis, regresi linear sederhana dalam R
Pada artikel kali ini kita akan membahas tentang Regresi Linear Sederhana dalam R dengan studi kasus Pengaruh Bakat terhadap Keahlian Bermain Bulutangkis. Kasus ini diambil karena penulis juga menyukai olahraga sejuta umat di Indonesia ini.
Regresi linier sederhana merupakan suatu teknik pemodelan prediktif yang digunakan untuk melihat hubungan antara variabel independent (biasanya disimbolkan dengan x) dengan variabel dependen (y) menggunakan garis lurus. Hubungan variabel tersebut dapat dibuat dalam bentuk model persamaan linear: y=a+bx.
Di mana:
- a: intercept atau konstanta
- b: koefesien dari variabel x.
Contoh permasalahan yang bisa dimodelkan dengan regresi linear sederhana seperti: pengaruh promosi terhadap penjualan, bimbingan belajar dengan nilai ujian, jumlah pendapatan dengan tingkat kebahagiaan dan sebagainya.
Untuk kasus pengaruh bakat terhadap keahlian bermain bulutangkis dengan regresi linear sederahana ini cuma contoh semata untuk memudahkan memudahkan pemahaman dan pengaplikasiannya. Pada kenyataanya keahlian bermain bulutangkis seseorang ditentukan oleh banyak faktor lain.
Sebelum memulai kita buat dulu kerangka kasus menjadi seperti ini:
- Alternatif judul : Pengaruh Bakat yang diimiliki terhadap Keahlian Bermain Bulutangkis di Perkumpulan Olahraga Tepuk Bulu.
- Rumusan Masalah: Apakah terdapat pengaruh antara bakat terhadap Keahlian Bermain Bulutangkis di Perkumpulan Olahraga Tepuk Bulu?
- Hipotesis: Terdapat pengaruh antara bakat terhadap Keahlian Bermain Bulutangkis di Perkumpulan Olahraga Tepuk Bulu.
- Kriteria Penerimaan Hipotesis
- Ho (hipotesis nol): Tidak terdapat pengaruh antara bakat terhadap keahlian bermain bulutangkis di Perkumpulan Olahraga Tepuk Bulu.
- Ha (hipotesis alternatif): Terdapat pengaruh antara bakat terhadap keahlian bermain bulutangkis di Perkumpulan Olahraga Tepuk Bulu.
Nah, bagaimana implementasi regresi linear sederhana tersebut dalam bahasa R? Kita akan bahas step demi step sampai tuntas. Untuk kemudahan dan kenyamanan melakukan koding, saya menyarankan anda menggunakan format R Markdown pada RStudio. Dokumentasi penggunaanya dapat anda baca di sini.
Langkah-langkah regresi linear sederhana dalam R.
Berikut langkah-langkah untuk menyelesaikan kasus dengan regresi linear sederhana dalam R.
Langkah 1. Import Library
Untuk menyelesaikan kasus regresi linear ini kita memerlukan 2 buah library yaitu: ggplot dan ggpubr.
library(ggplot2) library(ggpubr)
Langkah 2. Load dataset dan menampilkan summary data
Dataset yang digunakan dalam latihan ini dapat anda download pada bagian bawah artikel ini beserta source code-nya. Dataset terdiri dari variabel Bakat yang menjadi variabel independent (bebas) atau x, dan variabel Keahlian yang nantinya menjadi variabel dependent (terikat) atau y. Setelah dataset anda download letakkan pada folder datas. Anda bisa juga menyesuaikan sesuai dengan nama folder lain.
df<-read.csv("datas/bakat_keahlian.csv") summary(df)
Jika anda jalankan maka hasilnya akan menjadi:
Bakat Keahlian
Min. :43.00 Min. :52.00
1st Qu.:54.50 1st Qu.:68.00
Median :64.00 Median :75.00
Mean :65.48 Mean :75.61
3rd Qu.:75.50 3rd Qu.:83.00
Max. :85.00 Max. :95.00
Langkah 3. Cek Distribusi Normal
Asumsi dari regresi linear adalah variabel dependent (y) terdistribusi secara normal yang digambarkan dengan grafik bell curve atau menyerupai bentuk lonceng. Untuk melihat sebaran kita buat perintah berikut:
hist(df$Keahlian)
Kemudian kita jalankan, maka hasilnya adalah:
Dari gambar histrogram diatas, secara kasat mata kita melihat kurva memuncak di bagian tengah dan melandai di sisi kiri dan kanan (bell curve). Dari histogram itu kita bisa melanjutkan proses regresi linear sederhana ini.
Langkah 4. Cek Hubungan Linear
Hubungan antara variabel independent dengan variabel dependent harus linear. Kita bisa melihatnya dengan visualisasi berupa scatter plot berikut ini.
plot(Keahlian ~ Bakat, data = df)
Kita jalankan maka hasilnya akan menjadi seperti gambar berikut:
Dari gambar tersebut kita melihat ada hubungan linear antara Bakat dengan Keahlian.
Langkah 5. Analisis Regresi Linear Sederhana
Untuk melakukan analisis regresi linear sederhana dan mengecek hasilnya, kita bisa membuat perintah untuk membuat model persamaan sebagai berikut:
model<-lm(Keahlian ~ Bakat, data = df) summary(model)
Setelah dijalankan maka hasilnya akan seperti pada tampilan berikut ini:
Call:
lm(formula = Keahlian ~ Bakat, data = df)
Residuals:
Min 1Q Median 3Q Max
-6.5805 -1.6786 0.6263 1.8236 5.0208
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 16.69150 2.86826 5.819 2.62e-06 ***
Bakat 0.89978 0.04308 20.885 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 2.88 on 29 degrees of freedom
Multiple R-squared: 0.9377, Adjusted R-squared: 0.9355
F-statistic: 436.2 on 1 and 29 DF, p-value: < 2.2e-16
Interpretasi Hasil Persamaan
Dari hasil summary di atas, terlihat bahwa konstanta atau intercepet (a) sebesar 16.69150 dan koefesien x sebesar 0.89978. Sehingga kita mendapatkan model persamaan menjadi:
Y=16.7 + 0.89978 x
- Konstanta sebesar 16.7 artinya, tanpa Bakat (x=0), orang dalam Perkumpulan Olahraga Tepuk Bulu tersebut mempunyai keahlian bermain bulutangkis sebesar 16.7.
- Koefesien x sebesar 0.89978 artinya, setiap 1 point bakat, maka keahlian orang bermain bulutangkis dalam Perkumpulan Olahraga Tepuk Bulu tersebut mencapai 0.89978.
Interpretasi hasil Uji t :
Uji t digunakan untuk mengetahui apakah variabel bakat (X) berpengaruh secara signifikan terhadap variabel Kehlian (Y).
- Nilai uji t dari variabel Bakat adalah 20.885.
- Nilai p-value lebih kecil dari 2e-16 atau hampir nol, yang akan menunjukkan apakah model cocok dengan data.
- Pada p-value variabel bakat ada tanda bintang *** yang artinya mempunyai signifikansi 0.001, di mana itu lebih kecil dari dari 0.05 (αlpha = 5%) dan secara otomatis Ha diterima dan Ho ditolak.
- Kesimpulan : Bahwa terdapat pengaruh secara signifikan antara bakat dengan keahlian bermain bulutangkis. Jadi dalam kasus ini dapat disimpulkan bahwa bakat berpengaruh keahlian bermain bulutangkis pada Perkumpulan Olahraga Tepuk Bulu.
Langkah 6. Prediksi Hasil
Setelah mendapatkan model persamaan, kita coba untuk memprediksi hasil jika seseorang mempunyai nilai bakat tertentu. Misalnya kita ingin memprediksi jika bakat dengan nilai 56 dan 82. Maka untuk mencoba menerapkan pada model yang sudah dibuat dengan perintah:
predict(model,data.frame(Bakat=c(56,82)))
Maka hasilnya akan menjadi seperti tampilan berikut:
1 2
67.07946 90.47387
Langkah 7. Visualisasi Hasil dalam Bentuk Grafik
Untuk membuat visualisasi yang lebih bagus kita memanfaatkan library ggplot yang sudah kita sertakan di awal.
Membuat Plot Data
grafik<-ggplot(df, aes(x=Bakat, y=Keahlian))+ geom_point() grafik
Menambah Garis Persamaan pada Grafik
grafik <- grafik + geom_smooth(method="lm", col="red") grafik
Menambahan Model Persamaan pada Grafik
grafik <- grafik + stat_regline_equation(label.x.npc = "center") grafik
Grafik siap untuk publikasi
grafik + theme_bw() + labs(title = "Pengaruh Bakat terhadap Keahlian Bermain Bulutangkis", subtitle = "Pada Perkumpulan Olahraga Tepuk Bulu", x = "Bakat (0 s/d 100)", y = "Keahlian (0 s/d 100)")
Ok, demikian artikel tentang regresi linear sederhana dalam R. Jika ada saran, kritik dan masukkan silahkan isi pada kolom komentar di bawah.
Download Regresi Linear Sederhana dalam R
Klik tombol Facebook / Twitter / Google + untuk Download
Komentar tentang Regresi Linear Sederhana dalam R (Pengaruh Bakat terhadap Keahlian Bermain Bulutangkis)