Model Loglinear dengan SPSS

Artikel kali ini akan mengupas Model Loglinear dengan SPSS. Agar lebih aplikatif, penjelasan model loglinear langsung merujuk pada contoh kasus.

Contoh kasus berikut dicuplik dari Contoh 9.2.4 Buku Categorical Analysis karya fenomenal Alan Agresti. Data hasil survey kepada 2.276 mahasiswa tingkat akhir yang tinggal di sekitar Dayton, Ohio apakah mereka pernah mengonsumsi alkohol (A), rokok (C), atau Ganja (M). Data selengkapnya disajikan pada Tabel 1.

Tabel 1. Konsumi Alkohol, Rokok dan Ganja Mahasiswa Tingkat Akhir

Alkohol (A)Rokok (C)Ganja (M)Jumlah
YaYaYa911
YaYaTidak538
YaTidakYa44
YaTidakTidak456
TidakYaYa3
TidakYaTidak43
TidakTidakYa2
TidakTidakTidak279
Sumber: Agresti (2013), Categorical Data Analysis 3rd Edition p. 346

Tujuan analisis kali ini adalah:

  1. Temukan satu model yang mampu memprediksi isi jumlah (frekuensi) dari masing-masing kombinasi konsumsi alkohol, rokok dan ganja.
  2. Estimasi parameter dari model terbaik
  3. Interpretasi output dari model yang digunakan

Menemukan Model Terbaik

Memperhatikan semua variabel yang digunakan bersifat kategorik dan tidak membedakan mana variabel dependen dan independen makan Model Loglinear bisa menjadi pilihan utama. Namun jika variabel M (Konsumsi Ganja) dianggap sebagai variabel dependen dan dua variabel lainnya sebagai variabel independen maka Model Regresi Logistik bisa menjadi alternatif lain. Kali ini, Saya memilih model loglinear untuk menjawab tujuan penulisan artikel ini.

Secara ringkas model loglinear dibangun dari pertimbangan bahwa isi setiap sel bisa diprediksi dengan formula sebagai berikut :

μijk = μαiβjγk (1)

Di mana :

μijk = jumlah kasus pada sel kolom ke-i kolom ke-j dan kolom ke-k

μ = jumlah total kasus

αi = sub jumlah kasus variabel A

βj = sub jumlah kasus variabel C

γk = sub jumlah kasus variabel M

Dengan memberikan logaritma pada ruas kiri dan kanan persamaan (1) maka akan diperoleh

log μijk = log μ+log αi+log βj+log γk (2)

log μijk = λ + λA + λC + λM (3)

Persamaan 3 adalah model loglinear tiga variabel yang hanya mempertimbangkan efek utama. Jika antar variabel diasumsikan saling berinteraksi makan model loglinear lengkap disebtu saturated model yang dituliskan sebagai berikut:

log μijk = λ + λA + λC + λM + λAC + λCM + λCM + λACM (4)

Untuk memudahkan penulisan, model pada persamaa (3) cukup ditulis (A,C,M) dan persamaan (4) tulis (ACM). Dengan demikian jika pembaca menemukan model loglinear yang dituliskan (AC,AM,CM) maka model loglinearnya menjadi

log μijk = λ + λA + λC + λM + λAC + λCM + λCM (5)

Pemilihan Model Loglinear Terbaik dengan SPSS

Data pada Tabel 1 dipindahkan dalam bentuk format SPSS sebagaimana pada Gambar 1.

Gambar 1

Lengkapi label setiap variabel seperti tampak pada Gambar 2.

Gambar 2

Kita mulai membentuk model loglinear terbaik. Pertama klik menu

  • Data
    • Weight Cases

Pindahkan variabel “FREQ” seperti tampak pada Gambar 3, klik button OK untuk eksekusi.

Gambar 3

Langkah berikutnya adalah membentuk model regresi linear terbaik. Klik menu

  • Analyze
    • Loglinear
      • Model Selection
Gambar 4

Seleksi variabel A, C dan M secara bersamaan dan pindahkan ke kotak Factors. Klik Define Range dan isikan 1 pada kotak Minimum dan 2 pada kotak Maximum yang menunjukkan bahwa variabel A, C dan M masing-masing hanya memiliki dua level. Klik Contnue untuk kembali ke jendela Model Selection Loglinear Analysis. Perhatikan Gambar 5 untuk lebih jelas.

Gambar 5
Gambar 6

Klik Model untuk masuk ke Jendela Loglinear Analysis Model. Biarkan default pemilihan model yaitu Saturated Model (Gambar 7). Klik Continue untuk kembali ke jendela Model Selection Loglinear Analysis.

Selanjutnya klik Option untuk masuk ke jendela Loglinear Analysis: Option. Beri penanda (check) pada pilihan Frequencies dan Residuals pada tab Display dan Parameter estimates dan Association table pada tab Display for Saturated Model. Klik Continue untuk kembali ke Jendela Model Selection Loglinear Analysis.

Gambar 8

Langkah terakhir memberi penanda pada list button Use bacward elimination. Pilihan ini memerintahkan SPSS untuk memilih model loglinear terbaik dengan cara membuat model saturated lebih dulu (ACM) selanjutnya menghilangkan interaksi variabel maupun efek utama yang tidak signifikan. Klik OK untuk menghasilkan output loglinear analysis.

Output 1

Informasi data pada Output 1 di atas menginformasikan bahwa ada 8 cases yang valid dan terdapat 2.276 cases keseluruhan. Hal ini sesuai dengan data pada Tabel 1.

Output selanjutnya manampilkan Design 1. Model melibatkan interaksi 3 variabel. SPSS akan menambahkan nilai 0,500 pada setiap sel khusus untuk model saturated ini.

Output berikutnya menampilkan uji pengaruh interaksi beberapa variabel pada tabel K-Way and Higher-Order Effects. Efek utama dan efek interaksi dua variabel masih sangat signifikan membentuk model loglinear terbaik. Hal ini ditunjukkan dengan nilai P-value (kolom Sig) baik statistik uji Likelihood ratio maupun Pearson kurang dari 0,05. Sebaliknya, menyertakan interaksi tiga variabel berdampak pada pembentukan model loglinear yang buruk yang ditandai dengan nilan P-value (Sig) lebih besar dari 0,05. Singkat kata, output K-Way and Higher-Order Effects ini menginformasikan kepada kita bahwa model loglinear terbaik hanya melibatkan paling banyak interaksi dua variabel.

Untuk lebih jelasnya, pembaca bisa memperhatikan output Parameter Estimates sebagai berikut. Tampak bahwa nilai sig untuk estimasi parameter interaksi tiga variabel A*C*M lebih besar dari 0,05, sehingga efek interaksi ketiga variabel ini harus dikeluarkan dari model loglinear.

Pembaca masih ingat tentunya bahwa kita memilih metode backward elimination untuk memilih model terbaik bukan? Output ini bisa dibaca pada bagian Backward Elimination Statistics seperti berikut.

Melalui output Backward Elimination Statistics diperoleh informasi efek interaksi dua variabel mana saja yang membentuk model loglinear terbaik. Berdasarkan output ini model loglinear terbaik melibatkan interaksi dua variabel AC, AM dan CM. Hal ini ditunjukkan dengan nilai sig ketiga interaksi dua variabel tersebut kurang dari 0,05 yang bermakna bahwa estimasi paramater ketiganya tidak sama dengan nol atau ada nilainya. Sampai tahapan ini, kita sudah memperoleh model loglinear terbaik dari Tabel 1 yaitu model (AC, AM, CM) yang dinyatakan pada Persamaan (5) di atas yang ditulis kembali sebagai berikut:

log μijk = λ + λA + λC + λM + λAC + λCM + λCM

Estimasi Parameter Model Loglinear (AC, AM, CM)

Untuk menghasilkan nilai estimasi parameter dari model loglinear (AC, AM, CM) dapat ditempuh melalui langkah-langkah sebagai berikut:

  • Analyze
    • Loglinear
      • General
Seleksi variabel A, C, dan M lalu pindahkan ke kotak Factors
Klik Model
Seleksi ketiga variabel, pilih Main effect pada Build Terms lalu klik panah kanan. Lanjutkan dengan memasukkan interaksi 2 variabel secara bersamaan. Akhiri denfan klik Continue. Lalu buka jendela Option.
Centang Estimates untuk menghasilkan output estimasi parameter. Akhiri dengan klik Continue. Selanjutnya buka jendela Save…
Centang Predicted values untuk menghasilkan nilai dugaan setiap sel.

Uji Model Fit dan Estimasi Parameter

Uji kecocokan model dalam SPSS menggunakan Likelihood Ratio dan Pearson Chisquare. Hipotesis nol adalah model (AC, AM, CM) sesuai melawan model saturated (ACM) yang sesuai. Nilai P-value (Sig) dari kedua uji statistik lebih besar dari 0,05 mengindikasikan tidak menolak Ho yang berarti Model (AC, AM, CM) Fit/sesuai dengan data pada Tabel 1.

Estimasi parameter dari model (AC, AM, CM) disajikan pada output Parameter Estimates. Kolom pertama memuat parameter yang diestimasi. Misal parameter [A=1]*[C=1] bernilai 0,565 merujuk pada nilai estimasi parameter λAC untuk mahasiswa tingkat akhir yang mengonsumsi alkohol (A=1) dan juga merokok (C=1). Perhatikan nilai estimasi parameter untuk level terbesar setiap variabel bernilai nol.

Seberapa dekat nilai dugaan frekuensi setiap sel pada Tabel 1 dinyatakan melalui output Cell Counts and Residuals berikut.

Perhatikan kolom (6) dan kolom (4), nilai keduanya sangat berdekatan. Dengan kata lain, model (AC, AM, CM) tersebut memberikan nilai residual yang paling kecil dibandingkan model lainnya.

Interpretasi Nilai Estimasi Parameter Loglinear

Interpretasi nilai estimasi parameter loglinear melalui Odd Ratio. Analisi odd ratio model loglinear dapat digunakan pada kasus Conditional Association dengan memanfaatkan nilai estimasi parameter yang dihasilkan. Misal kita ingin menghitung Odd Ratio AC pada model (AC, AM, CM) pada nilai M tertentu. Nilai Odd Ratio AC tersebut dihitung dengan formula:

OR AC = exp (est[A=1]*[C=1] + est[A=2]*[C=2] + est[A=1]*[C=2] + est[A=2]*[C=1])) atau

exp (0,656 + 0,000 – 0,488 – (-1,877)) = exp (2,055) = 7,8

Dengan cara yang sama nilai Odd ratio interaksi dua variabel lain disajikan pada Tabel 2.

Tabel 2. Nilai Odd Ratio

ModelGiven MGiven CGiven A
(AC, AM, CM)ACAMCM
Odd Ratio7,819,817,3

Interpretasi Odd Ratio AC sebesar 7,8 sebagai berikut. Di antara mahasiswa yang mengkonsumsi ganja, kecenderungan mahasiswa tingkat akhir yang mengkonsumsi alkohol akan merokok 7,8 kali lebih tinggi dibandingkan mahasiswa yang tidak konsumsi alkohol. Di antara mahasiwa perokok, mahasiswa yang konsumsi alkohol cenderung akan konsumsi ganja 19,8 kali lebih tinggi dibandingkan mahasiswa yang tidak konsumsi alkohol. Bagaimana dengan kasus di antara mahasiswa yang konsumsi alkohol, bagaimana kecendrungan mahasiwa yang merokok akan mengonsumsi ganja dibanding yang tidak merokok ? silakan ketik di kolom komentar.

Odd Ratio Marginal Association

Odd Ratio juga bisa dihitung pada kondisi Marginal Association. Untuk kebutuhan ini, kita bisa memanfaatkan nilai dugaan sel pada output “Cell Counts and Residuals” pada kolom “Expected Count”. Misal Odd Ratio AC dari model loglinear (AC, AM, CM) secara marginal dapat dihitung dengan (910,383 + 538,617)(1,383+279,617) / ((44,617+455,383)(3,617+42,383)) = 17.7. Nilai Odd Ratio AM dan CM selengkapnya pada Tabel 3.

Tabel 3. Odd Ratio AC, AM dan CM untuk kondisi Marginal Association

ModelACAMCM
(AC,AM,CM)17,761,925,1

Interpretasi Tabel 3 sebagai berikut:

  • Kecenderungan mahasiswa yang konsumsi alkohol akan merokok lebih tinggi 17,7 kali dibandingkan mahasiswa yang tidak konsumsi alkohol.
  • Kecenderungan mahasiswa yang konsumsi alkohol akan konsumsi ganja lebih tinggi 60,9 kali dibandingkan mahasiswa yang tidak konsumsi alkohol.
  • Kecenderungan mahasiswa yang merokok akan konsumsi ganja lebih tinggi 25,1 kali dibandingkan mahasiswa yang tidak merokok.

Video tutorial untuk membangun model loglinear dapat dilihat di link berikut https://youtu.be/MxjvKVct3YA

Semoga bermanfaat.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s