Artikel ini merupakan kelanjutan dari posting artikel berjudul, ‘Memahami Model Regresi Linear Dengan Data Simulasi’. Setelah memahami proses membangkitkan data yang diperlukan untuk memahami model statistik (deterministik), maka kita fahami fenomena pemodelan regresi linear.
Salah satu unsur yang menjadi perhatian dalam analisis regresi adalah koefisien determinasi yang biasa disimbolkan dengan R kuadrat (R-square). Koefisien Determinasi merupakan salah ukuran yang menyatakan besarnya pengaruh variabel independen terhadap variabel dependen. Kisaran koefisien determinasi antara nol (tidak ada pengaruh) dan 100 (pengaruh sempurna). Sebagai mahasiswa yang mengadakan penelitian akan berbangga hati apabila dihasilkan koefisien determinasi di atas 80 persen. Pertanda kelulusan sarjana sudah di ambang pintu, tinggal menunggu pembantaian Dosen Penguji. Lalu, bagaimana jika koefisien determinasi yang dihasilkan cuilik….?
Untuk menjelaskan mengapa koefisien determinasi kecil (kurang dari 50 persen), Penulis melakukan simulasi data seperti pada posting sebelumnya menggunakan error dengan varians bervariasi antara 1 hingga 10. Dengan bantuan Minitab 14 diperoleh data sebagai:
No. | Y | a | X | e | Persamaan Regresi | R-square |
1 | normal(3,2) | 5 | fixed | normal(0,1) | Y = 4.46 + 1.53 X | 81.00% |
2 | normal(3,2) | 5 | fixed | normal(0,2) | Y = 4.13 + 1.02 X | 48.00% |
3 | normal(3,2) | 5 | fixed | normal(0,3) | Y = 3.60 + 0.547 X | 20.60% |
4 | normal(3,2) | 5 | fixed | normal(0,4) | Y = 3.44 + 0.386 X | 18.70% |
5 | normal(3,2) | 5 | fixed | normal(0,5) | Y = 3.31 + 0.209 X | 7.70% |
6 | normal(3,2) | 5 | fixed | normal(0,6) | Y = 3.27 + 0.229 X | 9.50% |
7 | normal(3,2) | 5 | fixed | normal(0,7) | Y = 3.12 + 0.156 X | 11.10% |
8 | normal(3,2) | 5 | fixed | normal(0,8) | Y = 3.18 + 0.0654 X | 1.20% |
9 | normal(3,2) | 5 | fixed | normal(0,9) | Y = 3.29 + 0.154 X | 13.30% |
10 | normal(3,2) | 5 | fixed | normal(0,10) | Y = 3.17 + 0.0716 X | 3.50% |
Tahapan untuk mendapatkan data di atas sebagai berikut. Pertama 100 data berdistribusi normal dengan rata-rata 3 dan varins 2 dibangkitkan. Selanjutnya nilai 5 ditetapkan sebagai konstanta. Berikutnya 100 data berdistribusi dengan rata-rata nol dan varians bervariasi antara satu dan 10 dibangkitkan sebagai error yang akan diteliti pengaruhnya terhadap koefisien determinasi. Data X pada kolom empat dihitung dengan persmaan
kolom 4 = (kolom 2 – kolom 3 – kolom 5)/2. Ini dilakukan karena model yang akan dibangun adalah y = a + 2x + error. Untuk memudahkan proses pengolahan, Penulis gunakan makro minitab sebagai berikut:
GMACRO
REGRESI
Random 100 C1;
Normal 3 2.
Set C2
100( 5 : 5 / 1 )1
End.
Do K1=1:10
Random 100 C3;
Normal 0 K1.
LET C4=(C1-C2-C3)/2
Plot ‘Y’*’X’;
Symbol.
Regress ‘Y’ 1 ‘X’;
Constant;
Brief 2.
ENDDO
ENDMACRO
Dengan meninvoke makro tersebut akan diperoleh hasil seperti pada Tabel di atas.
Tampak pada Tabel di atas, semakin kecil varians error maka semakin besar nilai koefisien determinasi yang dihasilkan. Sebaliknya, semakin besar varians error maka semakin kecil nilai koefisien determinasi model regresi linear itu. Apa hikmahnya?
Varians Error menggambarkan variasi data secara langsung. Semakin besar variasi data penelitian akan berdampak pada semakin besar varians error. Sebagai peneliti pemula, terkadang kita mengabaikan variasi data yang hendak diteliti. Rancangan Kuesioner yang Tidak Reliabel, Teknik Wawancara/Pengumpulan Data semuanya mempunyai kontribusi pada variasi data yang dihasilkan.
Pada survei dengan skala besar yang dilakukan oleh Badan Pusat Statistik sumber variasi bisa disebabkan oleh perbedaan pemahaman instruktur, perbedaan pemahaman pengawas/pencacah, perbedaan kualitas pencacah, dan perbedaan pemahaman responden dalam menangkap maksud item pertanyaan dalam kuesioner.
Semoga artikel ini bisa menjelaskan mengapa koefiesien determinasi bernilai kecil.
Assalamualaikum Wr.Wb….
Pak maaf mau tanya, kan nilai koefisien determinasi saya kecil hanya 15%, untuk 3 variabel independen dan 1 variabel tidak berpengaruh. Menurut dosen pembimbing saya tidak apa apa, asal punya alasan aja. Itu alasannya apa ya pak? Berapa koefisien determinasi jika penelitian dianggap baik? Nah terus apakah penelitian saya bisa diterima?
Koefisien determinasi dari regresi linear terbatas pada informasi apakah variabel independen mempengaruhi variabel dependen dalam pola linear. Nilai koef determinasi yang kecil salah satunya disebabkan karena pola yang tidak linear antara variabel independen dan dependen. Berapa koef determinasi yang baik? Bergantung pada tujuan penelitian.
Selamat malam.
Saya mau tanya, kalau R square kecil sebesar 5,8%, tapi uji simultan(uji f) signifikan dan hasil uji parsial (uji t) 2 variabel signifikan dan 1 tidak signifikan. Kenapa bisa terjadi R square kecil tapi simultan signifikan dan parsial signifikan, kenapa ya?? Bisa di beri penjelasannya??.
Terimakasih.
Sore kak, saya mau tanya.
Kasus saya sama seperti yg kakak jelaskan. Saya memiliki 3 variabel independen. 2 variabel berpengaruh signifikan dan yg 1 nya tidak berpengaruh signifikan. Uji asumsi klasik normalisasi multi, auto sama hetero nya tidak ada masalah. Namun nilai determinasi r nya hanya bisa menjelaskan 9,4%. Apakah ada solusi untuk meningkatan nilai determinasinya?
Mohon bantuannya kak, terimakasih
Gimana hasilnya? Saya penasaran
ass, pak apakah ada refrensi untuk ketentuan R square cukup baik, dikatakan baik, sangat baik dan sempurna? trima kasih sebelumnya
mhn info: brp stndr/kategori ukuran bsr kecil r square? apa penyebab r square kecil? tks
it is very helpful! Thanks!
assalamualaikum…saya mw tnya..jika koefisien determinasi (R^2) = 0, apakah tidak ada hubungan??…dan jika tidak ada hubungan,alasannya apa??
terimakasih..
Ass…wr…wb…
Bpak,sy ingin bertanya,sy sedang melakukan penelitian,,tp sy bingung krn adjusted R squarenya negatif,kira2 apa alasan mengapa adjusted R squarenya negatif??yg nantinya akan sy cantumkan dalam penelitian sy???
Terima kasih sebelumnya
assalamualaikum
Bapak…saya sudah melakukan penelitian dan ternyata hasil r skuarenya negatif 0,05, ada cara lain untuk mengatasi hal ini tidak ??apakah penelitian saya dianggap gagal??
saya sudah mencari data dan berputar2 nyebar kuesioner ke 52 perusahaan pak T_T….mohon penjelasannya…..
terima kasih sebelumnya…..
aslm. Pak, sy mw minta file tentang M estimator dan LTS estimatimator?????bpk kan py buku MARONA, tolong kirim ke email sy y pak???????mksh. Sy lg nyususn Tugas Akhir pak…..mohon bantuannya
salam bapak .. saya mau tanya, apabila hasil uji menunjukkan hasil 0,799 apakah itu bisa dikategorikan terdapat hubungan yg kuat? krn setahu saya, apabila hasil R nya diatas 0,800 dikatakan mempunyai hubungan yg kuat. apakah hasil R 0,799 itu bisa dikatakan tidak kuat?
terimakasih
asw,pak saya mau tanya lagi..apakah ada batasan nilai R square yang optimum untuk data cross section??
karena hasil olahan data cross section, R square nya rendah sekitar 20-30…terima kasih sebelumnya
@ hafiz: Dalam dunia modelling, kita berharap agar variasi data dapat terjelaskan oleh data yang kita teliti. Pada kasus Hafiz, sebagian besar variasi data terjelaskan oleh variabel lain di luar variabel penelitian yang diajukan. Itu artinya, variabel penjelas yang Hafiz ajukan hanya mampu menjelaskan 20-30 persen variasi data. Peneliti biasanya akan yakin menjelaskan hasil penelitian apabila model yang diajukan mampu menjelaskan variasi data minimal 80 persen. Jika tidak, Hafiz harus mengeksplorasi “why” data Hafiz menghasilkan R square yang kecil dengan banyak merujuk pada penelitian sejenis sebelumnya.
asw, pak in hafiz lagi…data yang saya punya itu liniear dan outlier sdh sya buang..tp r square nya msh kecil..saya mlakukan 3 regresi msg2 r squarenya 19, 23 dan 30..
itu gmn pak??
terima ksih sblmnya
assalamualikum pak..saya mahasiswa yang sedang dalam tahap menyelesaikan tugas akhir…r square dalam penelitian saya kecil krn memakai data primer..apakah memang kalau memakai data primer r square kecil dan apakah klau memakai data sekunder r squarenya besar??kenapa bisa seperti itu??
terima kasih sebelumnya
assalamualaikum pak, saya sedang menyelesaikan tugas akhir kuliah..dlm pnelitian saya r square nya kecil krn data primer…apakah kalau data primer r squarenya memang kecil dan apakah kalau data sekunder r squarenya memabg cukup besar??kenapa bisa seperti itu..
mohon bantuannya pak
terima kasih
Selamat sore Pak,
Saya mencoba-coba pake tools regresi di MS-Excel, hasil r-square nya 0,0108, tp adjusted r-square-nya kok -0,0082 ya Pak (nilainya negatif), kenapa bisa begitu Pak? Terimakasih atas penjelasannya.
Ass.. wr. wb.
pak, saya mau tanya, dalam skripsi yang sedang saya kerjakan, hasil dari uji t dan uji f, angka2nya cukup signifikan, tapi nilai koef. determinasi (r2)nya rendah. apa kira2 yang salah dengan penelitian saya? bagaimana membuat nilai r2 jadi lebih baik tanpa menambah variabel, jika memungkinkan? terima kasih..
salam pak…
saya mahasiswi pendidikan yg sedang bergelut dengan skripsi…
tolong bantuannya…
saya melakukan penelitian dengan judul pengaruh motivasi belajar dan peranan orangtua terhadap prestasi belajar siswa SMA pada pelajaran biologi..
yg mau saya tanyakan adalah apakah penelitian dengan judul pengaruh tidak bisa melakukan teknik analisa data dengan uji regresi berganda??? (saat saya seminar proposal, dosen penguji saya meminta saya menggantinya karna salah)
beliau mengatakan regresi berganda adalah uji untuk penelitian korelasi/hubungan bukan pengaruh…
lalu beliau menyuruh saya membuang 1 variabel independen saya,dan menggunakan uji regresi sederhana…
tolong bantu saya,uji analisa data apa yg harus saya pakai untuk 2 variabel independen dan 1 variabel terikat dengan judul pengaruh…
lalu jika 1 variabel independen dan 1 variabel terikat dengan judul hubungan…. menggunakan teknik analisa data apa??
mohon dibalas ke email saya kalau bisa…
jawaban bapa sangat membantu saya yang sedang kebingungan sekali..trims
Jangan terlalu tenang meskipun nilai R-square besar, mendekati 1. Kan harus menguji dahulu keberartian model, multikolinearitas, dan autokorelasi,,,,masih buaaanyak dech.
apa sih arti sebenarna determinisasi dalam statistik ?
Pendek kata, determinasi bisa dimaknai yang menentukan atau yang mempengaruhi. Jadi, koefisien determinasi adalah koefisien yang menunjukkan besaran pengaruh variabel independen terhadap variabel dependen. Demikian.
@Suryana
Saya sangat TIDAK SETUJU dengan pernyataan koefisien determinasi yg dimaknai sebagai besaran pengaruh. Coba liat artikel ini, yang berjudul How Not to Lie with Statistics: Avoiding Common Mistakes in Quantitative Political Science. Artikel aslinya bisa diunduh di blog tersebut. Di sana dijelaskan beberapa kesalahan seputar statistik, salah satunya interpretasi dari koefisien determinasi.
Trims tuk “urung rembuknya” dan Selamat atas peluncuran PDA-nya.
Asslamu’alaikum.
saya ingin tanya.
Jika output uji annova memberikan nilai adjusted R square sebesar 0,05 atau 5% dan signifikansi 0,011, apakah model regresi berganda yang saya gunakan “jelek”? Terima kasih.
@ Ditya: Variabel independen yang Ditya masukkan dalam model hanya mampu menjelaskan 5 persen keragaman data. Itu sama artinya dengan 95 persen kergaman data dijelsakan oleh variabel independen lain yang belum dimasukkan dalam model. Nah, dengan pemahaman seperti itu apakah Ditya mau memaksakan model yang hanya mampu menjelaskan 5 persen keragaman data. Terima kasih.
pak, saya mau tanya…saya banyak melihat tesis yg r squarenya memang kecil…apakah kalau data panel itu r squarenya selalu kecil?
apakah r square itu berpengaruh thdp kevalidan data…thx
ass..wr.wb.
pak, saya mau tanya, pada artikel diatas kan disebutkan kalo variasi datanya tinggi, r squarnya jadi rendah, tapi pada hasil penelitian saya malah sebaliknya, variasi datanya rendah karena datanya time series dan r squarnya juga rendah, bagaimana itu pak?
@helwin: pemodelan time series yang saya ketahui tidak hanya satu macam. Ada banyak parameter yang harus diteliti lebih lanjut. Coba cek variasi residualnya siapa tahu di dalam residualnya itu sendiri masi mengandung pola tertentu (tidak konstan). Jika residual masih mengandung unsur time series, helwin bisa menambahkan model dari residualnya.
helwin lagi ini pak, bisa di jelaskan bagaimana sebenarnya kita tau variasi data itu rendah atau tinggi? mungkin sy masih salah dalam melihat, karena kemarin sy nanya sama temen katanya variasi data dilihat pada residual yang di anovax,menurut bapak bagaimana?terima kasih.
@ Helwin lagi: Saya sarankan Helwin mengeksplorasi data lebih dulu karena data yang Helwin punya mengandung unsur time series. Model time series mana yang cocok digunakan bergantung pada struktur datanya. Variasi data hanya salah satu unsur yang dijadikan pertimbangan. Untuk mengetahui variasi data Helwin bisa menggunakan varians jika data tunggal atau kovarians jika data bersifat multivariat.
Assalamu’alaikum, pak
Mau tanya pak, misalnya hasil Z hitung menyatakan adanya pengaruh secara signifikan antara variabel independent terhadap dependennya, tetapi nilai R2 kurang dari 50%. apakah artinya pak?
kemudian apakah terjadi salah pengolahan data sehingga terjadi demikian?
Assalamu’alaikum, pak..
setahu saya yang menyebabkan koefisien determinasi kecil atau tidak itu tergantung pada datanya. jika data yang digunakan banyak dummy (misal 3 dummy pada sebuah model) maka akan membuat koefisien determinasi kecil.
menurut buku yang telah saya baca sebelumnya, bagus atau tidaknya model memang ditentukan oleh koefisien determinasi. tapi, bukannya jika koefisien determinasi kecil lantas model tidak bagus. kalau seperti itu bagaimana menurut bapak?
Waalaikumsalam Sholikha,
Koefisien determinasi sangat tergantung dari variasi data. Semakin bervariasi data, maka semakin kecil koefisien determinasinya. Posting pada judul ini membuktikan hal itu dengan contoh simulasi data yang dibangkitkan dengan variasi data berbeda-beda. Terbukti, semakin besar variasi data koefisien determinasi semakin kecil.
Hubungan koefisien determinasi dan model regresi sangat berkaitan. Ketika koefisien determinasi kecil menandakan bahwa model yang terbangun tidak sesuai dengan pola datanya. Ingat, regresi linear misalnya mengasumsikan data X dan Y berpola linear. Kalau ternyata data sesungguhnya tidak berpola linear maka koefisien determinasi akan menghasilkan nilai yang kecil (kurang dari 50 persen). Demikian, terima kasih.
mas/mbak saya mau tanya nih, kalau misal dalam melakukan uji MRA terdapat hasil antara persamaan regresi sederhana nilai F dan koefisien determinasi mengalami peningkatan p0ada persamaan MRA apakah itu artinya variabel independen yg diteliti telah berfungsi sbg variabel pemoderasi, bagaimana jika F yg dihasilkan lebih kecil dari pada persamaan sederhananya? apa itu maksudnya? tp koefisien determinasi nya mengalami peningkatan, tetapi nilai F nya malah turun.
terima kasih banyak, dimohon jawabannya karena saya sedang menyelesaikan skripsi saya tapi saya masih bingung mengenai hal tersebut.
salam…