Artikel ini merupakan kelanjutan dari posting artikel berjudul, ‘Memahami Model Regresi Linear Dengan Data Simulasi’. Setelah memahami proses membangkitkan data yang diperlukan untuk memahami model statistik (deterministik), maka kita fahami fenomena pemodelan regresi linear.

Salah satu unsur yang menjadi perhatian dalam analisis regresi adalah koefisien determinasi yang biasa disimbolkan dengan R kuadrat (R-square). Koefisien Determinasi merupakan salah ukuran yang menyatakan besarnya pengaruh variabel independen terhadap variabel dependen. Kisaran koefisien determinasi antara nol (tidak ada pengaruh) dan 100 (pengaruh sempurna). Sebagai mahasiswa yang mengadakan penelitian akan berbangga hati apabila dihasilkan koefisien determinasi di atas 80 persen. Pertanda kelulusan sarjana sudah di ambang pintu, tinggal menunggu pembantaian Dosen Penguji. Lalu, bagaimana jika koefisien determinasi yang dihasilkan cuilik….?

Untuk menjelaskan mengapa koefisien determinasi kecil (kurang dari 50 persen), Penulis melakukan simulasi data seperti pada posting sebelumnya menggunakan error dengan varians bervariasi antara 1 hingga 10. Dengan bantuan Minitab 14 diperoleh data sebagai:

No. Y a X e Persamaan Regresi  R-square
1 normal(3,2) 5 fixed normal(0,1) Y = 4.46 + 1.53 X 81.00%
2 normal(3,2) 5 fixed normal(0,2) Y = 4.13 + 1.02 X 48.00%
3 normal(3,2) 5 fixed normal(0,3) Y = 3.60 + 0.547 X 20.60%
4 normal(3,2) 5 fixed normal(0,4) Y = 3.44 + 0.386 X 18.70%
5 normal(3,2) 5 fixed normal(0,5) Y = 3.31 + 0.209 X 7.70%
6 normal(3,2) 5 fixed normal(0,6) Y = 3.27 + 0.229 X 9.50%
7 normal(3,2) 5 fixed normal(0,7) Y = 3.12 + 0.156 X 11.10%
8 normal(3,2) 5 fixed normal(0,8) Y = 3.18 + 0.0654 X 1.20%
9 normal(3,2) 5 fixed normal(0,9) Y = 3.29 + 0.154 X 13.30%
10 normal(3,2) 5 fixed normal(0,10) Y = 3.17 + 0.0716 X 3.50%

Tahapan untuk mendapatkan data di atas sebagai berikut. Pertama 100 data berdistribusi normal dengan rata-rata 3 dan varins 2 dibangkitkan. Selanjutnya nilai 5 ditetapkan sebagai konstanta. Berikutnya 100 data berdistribusi dengan rata-rata nol dan varians bervariasi antara satu dan 10 dibangkitkan sebagai error yang akan diteliti pengaruhnya terhadap koefisien determinasi. Data X pada kolom empat dihitung dengan persmaan

kolom 4 = (kolom 2 – kolom 3 – kolom 5)/2. Ini dilakukan karena model yang akan dibangun adalah y = a + 2x + error. Untuk memudahkan proses pengolahan, Penulis gunakan makro minitab sebagai berikut:

GMACRO
REGRESI
Random 100 C1;
Normal 3 2.
Set C2
100( 5 : 5 / 1 )1
End.
Do K1=1:10
Random 100 C3;
Normal 0 K1.
LET C4=(C1-C2-C3)/2
Plot ‘Y’*’X';
Symbol.
Regress ‘Y’ 1 ‘X';
Constant;
Brief 2.
ENDDO
ENDMACRO

Dengan meninvoke makro tersebut akan diperoleh hasil seperti pada Tabel di atas.

Tampak pada Tabel di atas, semakin kecil varians error maka semakin besar nilai koefisien determinasi yang dihasilkan. Sebaliknya, semakin besar varians error maka semakin kecil nilai koefisien determinasi model regresi linear itu. Apa hikmahnya?

Varians Error menggambarkan variasi data secara langsung. Semakin besar variasi data penelitian akan berdampak pada semakin besar varians error. Sebagai peneliti pemula, terkadang kita mengabaikan variasi data yang hendak diteliti. Rancangan Kuesioner yang Tidak Reliabel, Teknik Wawancara/Pengumpulan Data semuanya mempunyai kontribusi pada variasi data yang dihasilkan.

Pada survei dengan skala besar yang dilakukan oleh Badan Pusat Statistik sumber variasi bisa disebabkan oleh perbedaan pemahaman instruktur, perbedaan pemahaman pengawas/pencacah, perbedaan kualitas pencacah, dan perbedaan pemahaman responden dalam menangkap maksud item pertanyaan dalam kuesioner.

Semoga artikel ini bisa menjelaskan mengapa koefiesien determinasi bernilai kecil.

About these ads