Artikel kali ini akan mengupas Model Loglinear dengan SPSS. Agar lebih aplikatif, penjelasan model loglinear langsung merujuk pada contoh kasus.
Contoh kasus berikut dicuplik dari Contoh 9.2.4 Buku Categorical Analysis karya fenomenal Alan Agresti. Data hasil survey kepada 2.276 mahasiswa tingkat akhir yang tinggal di sekitar Dayton, Ohio apakah mereka pernah mengonsumsi alkohol (A), rokok (C), atau Ganja (M). Data selengkapnya disajikan pada Tabel 1.
Tabel 1. Konsumi Alkohol, Rokok dan Ganja Mahasiswa Tingkat Akhir
Alkohol (A) | Rokok (C) | Ganja (M) | Jumlah |
Ya | Ya | Ya | 911 |
Ya | Ya | Tidak | 538 |
Ya | Tidak | Ya | 44 |
Ya | Tidak | Tidak | 456 |
Tidak | Ya | Ya | 3 |
Tidak | Ya | Tidak | 43 |
Tidak | Tidak | Ya | 2 |
Tidak | Tidak | Tidak | 279 |
Tujuan analisis kali ini adalah:
- Temukan satu model yang mampu memprediksi isi jumlah (frekuensi) dari masing-masing kombinasi konsumsi alkohol, rokok dan ganja.
- Estimasi parameter dari model terbaik
- Interpretasi output dari model yang digunakan
Menemukan Model Terbaik
Memperhatikan semua variabel yang digunakan bersifat kategorik dan tidak membedakan mana variabel dependen dan independen makan Model Loglinear bisa menjadi pilihan utama. Namun jika variabel M (Konsumsi Ganja) dianggap sebagai variabel dependen dan dua variabel lainnya sebagai variabel independen maka Model Regresi Logistik bisa menjadi alternatif lain. Kali ini, Saya memilih model loglinear untuk menjawab tujuan penulisan artikel ini.
Secara ringkas model loglinear dibangun dari pertimbangan bahwa isi setiap sel bisa diprediksi dengan formula sebagai berikut :
μijk = μαiβjγk (1)
Di mana :
μijk = jumlah kasus pada sel kolom ke-i kolom ke-j dan kolom ke-k
μ = jumlah total kasus
αi = sub jumlah kasus variabel A
βj = sub jumlah kasus variabel C
γk = sub jumlah kasus variabel M
Dengan memberikan logaritma pada ruas kiri dan kanan persamaan (1) maka akan diperoleh
log μijk = log μ+log αi+log βj+log γk (2)
log μijk = λ + λA + λC + λM (3)
Persamaan 3 adalah model loglinear tiga variabel yang hanya mempertimbangkan efek utama. Jika antar variabel diasumsikan saling berinteraksi makan model loglinear lengkap disebtu saturated model yang dituliskan sebagai berikut:
log μijk = λ + λA + λC + λM + λAC + λCM + λCM + λACM (4)
Untuk memudahkan penulisan, model pada persamaa (3) cukup ditulis (A,C,M) dan persamaan (4) tulis (ACM). Dengan demikian jika pembaca menemukan model loglinear yang dituliskan (AC,AM,CM) maka model loglinearnya menjadi
log μijk = λ + λA + λC + λM + λAC + λCM + λCM (5)
Pemilihan Model Loglinear Terbaik dengan SPSS
Data pada Tabel 1 dipindahkan dalam bentuk format SPSS sebagaimana pada Gambar 1.

Lengkapi label setiap variabel seperti tampak pada Gambar 2.

Kita mulai membentuk model loglinear terbaik. Pertama klik menu
- Data
- Weight Cases
Pindahkan variabel “FREQ” seperti tampak pada Gambar 3, klik button OK untuk eksekusi.

Langkah berikutnya adalah membentuk model regresi linear terbaik. Klik menu
- Analyze
- Loglinear
- Model Selection
- Loglinear

Seleksi variabel A, C dan M secara bersamaan dan pindahkan ke kotak Factors. Klik Define Range dan isikan 1 pada kotak Minimum dan 2 pada kotak Maximum yang menunjukkan bahwa variabel A, C dan M masing-masing hanya memiliki dua level. Klik Contnue untuk kembali ke jendela Model Selection Loglinear Analysis. Perhatikan Gambar 5 untuk lebih jelas.


Klik Model untuk masuk ke Jendela Loglinear Analysis Model. Biarkan default pemilihan model yaitu Saturated Model (Gambar 7). Klik Continue untuk kembali ke jendela Model Selection Loglinear Analysis.

Selanjutnya klik Option untuk masuk ke jendela Loglinear Analysis: Option. Beri penanda (check) pada pilihan Frequencies dan Residuals pada tab Display dan Parameter estimates dan Association table pada tab Display for Saturated Model. Klik Continue untuk kembali ke Jendela Model Selection Loglinear Analysis.

Langkah terakhir memberi penanda pada list button Use bacward elimination. Pilihan ini memerintahkan SPSS untuk memilih model loglinear terbaik dengan cara membuat model saturated lebih dulu (ACM) selanjutnya menghilangkan interaksi variabel maupun efek utama yang tidak signifikan. Klik OK untuk menghasilkan output loglinear analysis.

Informasi data pada Output 1 di atas menginformasikan bahwa ada 8 cases yang valid dan terdapat 2.276 cases keseluruhan. Hal ini sesuai dengan data pada Tabel 1.
Output selanjutnya manampilkan Design 1. Model melibatkan interaksi 3 variabel. SPSS akan menambahkan nilai 0,500 pada setiap sel khusus untuk model saturated ini.

Output berikutnya menampilkan uji pengaruh interaksi beberapa variabel pada tabel K-Way and Higher-Order Effects. Efek utama dan efek interaksi dua variabel masih sangat signifikan membentuk model loglinear terbaik. Hal ini ditunjukkan dengan nilai P-value (kolom Sig) baik statistik uji Likelihood ratio maupun Pearson kurang dari 0,05. Sebaliknya, menyertakan interaksi tiga variabel berdampak pada pembentukan model loglinear yang buruk yang ditandai dengan nilan P-value (Sig) lebih besar dari 0,05. Singkat kata, output K-Way and Higher-Order Effects ini menginformasikan kepada kita bahwa model loglinear terbaik hanya melibatkan paling banyak interaksi dua variabel.

Untuk lebih jelasnya, pembaca bisa memperhatikan output Parameter Estimates sebagai berikut. Tampak bahwa nilai sig untuk estimasi parameter interaksi tiga variabel A*C*M lebih besar dari 0,05, sehingga efek interaksi ketiga variabel ini harus dikeluarkan dari model loglinear.

Pembaca masih ingat tentunya bahwa kita memilih metode backward elimination untuk memilih model terbaik bukan? Output ini bisa dibaca pada bagian Backward Elimination Statistics seperti berikut.

Melalui output Backward Elimination Statistics diperoleh informasi efek interaksi dua variabel mana saja yang membentuk model loglinear terbaik. Berdasarkan output ini model loglinear terbaik melibatkan interaksi dua variabel AC, AM dan CM. Hal ini ditunjukkan dengan nilai sig ketiga interaksi dua variabel tersebut kurang dari 0,05 yang bermakna bahwa estimasi paramater ketiganya tidak sama dengan nol atau ada nilainya. Sampai tahapan ini, kita sudah memperoleh model loglinear terbaik dari Tabel 1 yaitu model (AC, AM, CM) yang dinyatakan pada Persamaan (5) di atas yang ditulis kembali sebagai berikut:
log μijk = λ + λA + λC + λM + λAC + λCM + λCM
Estimasi Parameter Model Loglinear (AC, AM, CM)
Untuk menghasilkan nilai estimasi parameter dari model loglinear (AC, AM, CM) dapat ditempuh melalui langkah-langkah sebagai berikut:
- Analyze
- Loglinear
- General
- Loglinear






Uji Model Fit dan Estimasi Parameter
Uji kecocokan model dalam SPSS menggunakan Likelihood Ratio dan Pearson Chisquare. Hipotesis nol adalah model (AC, AM, CM) sesuai melawan model saturated (ACM) yang sesuai. Nilai P-value (Sig) dari kedua uji statistik lebih besar dari 0,05 mengindikasikan tidak menolak Ho yang berarti Model (AC, AM, CM) Fit/sesuai dengan data pada Tabel 1.

Estimasi parameter dari model (AC, AM, CM) disajikan pada output Parameter Estimates. Kolom pertama memuat parameter yang diestimasi. Misal parameter [A=1]*[C=1] bernilai 0,565 merujuk pada nilai estimasi parameter λAC untuk mahasiswa tingkat akhir yang mengonsumsi alkohol (A=1) dan juga merokok (C=1). Perhatikan nilai estimasi parameter untuk level terbesar setiap variabel bernilai nol.

Seberapa dekat nilai dugaan frekuensi setiap sel pada Tabel 1 dinyatakan melalui output Cell Counts and Residuals berikut.

Perhatikan kolom (6) dan kolom (4), nilai keduanya sangat berdekatan. Dengan kata lain, model (AC, AM, CM) tersebut memberikan nilai residual yang paling kecil dibandingkan model lainnya.
Interpretasi Nilai Estimasi Parameter Loglinear
Interpretasi nilai estimasi parameter loglinear melalui Odd Ratio. Analisi odd ratio model loglinear dapat digunakan pada kasus Conditional Association dengan memanfaatkan nilai estimasi parameter yang dihasilkan. Misal kita ingin menghitung Odd Ratio AC pada model (AC, AM, CM) pada nilai M tertentu. Nilai Odd Ratio AC tersebut dihitung dengan formula:
OR AC = exp (est[A=1]*[C=1] + est[A=2]*[C=2] + est[A=1]*[C=2] + est[A=2]*[C=1])) atau
exp (0,656 + 0,000 – 0,488 – (-1,877)) = exp (2,055) = 7,8
Dengan cara yang sama nilai Odd ratio interaksi dua variabel lain disajikan pada Tabel 2.
Tabel 2. Nilai Odd Ratio
Model | Given M | Given C | Given A |
(AC, AM, CM) | AC | AM | CM |
Odd Ratio | 7,8 | 19,8 | 17,3 |
Interpretasi Odd Ratio AC sebesar 7,8 sebagai berikut. Di antara mahasiswa yang mengkonsumsi ganja, kecenderungan mahasiswa tingkat akhir yang mengkonsumsi alkohol akan merokok 7,8 kali lebih tinggi dibandingkan mahasiswa yang tidak konsumsi alkohol. Di antara mahasiwa perokok, mahasiswa yang konsumsi alkohol cenderung akan konsumsi ganja 19,8 kali lebih tinggi dibandingkan mahasiswa yang tidak konsumsi alkohol. Bagaimana dengan kasus di antara mahasiswa yang konsumsi alkohol, bagaimana kecendrungan mahasiwa yang merokok akan mengonsumsi ganja dibanding yang tidak merokok ? silakan ketik di kolom komentar.
Odd Ratio Marginal Association
Odd Ratio juga bisa dihitung pada kondisi Marginal Association. Untuk kebutuhan ini, kita bisa memanfaatkan nilai dugaan sel pada output “Cell Counts and Residuals” pada kolom “Expected Count”. Misal Odd Ratio AC dari model loglinear (AC, AM, CM) secara marginal dapat dihitung dengan (910,383 + 538,617)(1,383+279,617) / ((44,617+455,383)(3,617+42,383)) = 17.7. Nilai Odd Ratio AM dan CM selengkapnya pada Tabel 3.
Tabel 3. Odd Ratio AC, AM dan CM untuk kondisi Marginal Association
Model | AC | AM | CM |
(AC,AM,CM) | 17,7 | 61,9 | 25,1 |
Interpretasi Tabel 3 sebagai berikut:
- Kecenderungan mahasiswa yang konsumsi alkohol akan merokok lebih tinggi 17,7 kali dibandingkan mahasiswa yang tidak konsumsi alkohol.
- Kecenderungan mahasiswa yang konsumsi alkohol akan konsumsi ganja lebih tinggi 60,9 kali dibandingkan mahasiswa yang tidak konsumsi alkohol.
- Kecenderungan mahasiswa yang merokok akan konsumsi ganja lebih tinggi 25,1 kali dibandingkan mahasiswa yang tidak merokok.
Video tutorial untuk membangun model loglinear dapat dilihat di link berikut https://youtu.be/MxjvKVct3YA
Semoga bermanfaat.