Analisis Diskriminan dan Analisis Regresi (Stepwise)

Analisis diskriminan dan analisis regresi merupakan dua metode analisis yang berbeda. Perbedaan ini dapat ditinjau dari tujuan metode analisis dan jenis data respon (y). Dari sisi tujuan analisis, analisis diskriminan bertujuan untuk mengenali faktor-faktor yang dapat membedakan dua kelompok atau lebih. Faktor-faktor pembeda ini akan membentuk sebuah fungsi pembeda (disebut fungsi diskriminan). Setelah fungsi pembeda diketahui, analisis diskriminan selanjutnya dapat mengenali observasi baru dan mengelompokkan ke salah satu kelompok yang ada.

Berbeda dengan analisis diskriminan, analisis regresi bertujuan untuk membentuk sebuah fungsi yang dapat menjelaskan hubungan dua variabel, yaitu variabel penjelas/prediktor (x) dan variabel respon (y). Dalam hal ini, kita tidak mengenal pengelompokkan data sebelumnya.

Perhatikan ketiga scatterplot berikut:

Gambar 1.

Gambar 2.

Gambar 3.

Pada Gambar 1 tampak dua data (variabel) yang berasal dari dua kelompok yang berbeda. Analisis diskriminan sangat tepat digunkan pada contoh kasus Gambar 1. Di sini kita akan mencari sebuah fungsi (bisa linear, atau berupa kurva lengkung semisal parabola)  yang dapat memisahkan kedua kelompok ini. Tentunya, fungsi yang didapatkan akan mampu memisahkan dua kelompok data secara sempurna karena variabel x1 dan x2 pada Gambar 1 mencirikan kedua kelompok secara nyata. Artinya, kedua kelompok memang memiliki variansi yang sangat berbeda.

Gambar 2 menampilkan dua variabel yang dibedakan atas variabel prediktor (C7) dan variabel respon (y2). Didasarkan pada asumsi bahwa C7 mempengaruhi y2. Pertanyaannya, bagaimana bentuk hubungan antara C7 dan y2? Untuk menjawab pertanyaan ini kita dapat menggunakan model regresi. Model regresi dimaksudkan untuk mencari sebuah fungsi (dalam kasus ini fungsi garis/linear) yang dapat meminimumkan kesalahan antara nilai prediksi dengan data y2.

Pada Gambar 3, kita tidak mempunyai dasar bahwa x1 mempengaruhi x2 atau sebaliknya. Pada kasus ini x1 dan x2 keduanya merupakan variabel prediktor yang berasal dari dua kelompok yang berbeda (misal kelompok 1 = titik hitam dan kelompok 2 = titik merah). Kita tidak mencari sebuah fungsi yang menyatakan hubungan antara x1 dan x2. Yang kita cari adalah suatu fungsi f(x1,x2) yang dapat memisahkan antara kelompok hitam dan kelompok merah. Berbeda dengan Gambar 1, pada Gambar 3 ini kita dapat menemukan fungsi f(x1,x2) yang meminimalkan variasi dalam kelompok tetapi memaksimalkan variasi antar kelompok. Pada akhirnya, akan ditemukan kesalahan pengelompokkan. Misal, titik merah yang harusnya menjadi kelompok 2, oleh fungsi diskriminan dikelompokkan sebagai kelompok 1. Demikian sebaliknya. Ukuran salah pengelompokkan ini menjadi salah satu kriteria kebaikan dari fungsi diskriminan (Goodness of Fit) yang dalam model regresi diukur oleh besaran R kuadrat. Semakin kecil persentase salah pengelompokkan semakin baik fungsi diskriminan yang digunakan.

Perbedaan kedua antara analisis diskriminan dan regresi adalah dari sisi jenis variabel respon. Variabel respon dalam analisis diskriminan berbentuk kategorik yang menandakan kelompok sementara dalam model regresi berbentuk kontinyu (angka yang diperoleh dari hasil pengukuran).

Dalam praktiknya, variabel respon yang digunakan dalam penelitian biasanya lebih dari satu variabel. Oleh karena kita sulit mencari variabel penelitian yang benar-benar independen tidak jarang kita temui variabel yang masih berkorelasi meskipun kecil. Adanya korelasi di antara variabel ini akan mempengaruhi kebaikan suatu model. Tugas kita adalah memilah-milah variabel mana yang benar-benar mempengaruhi variabel respon (dalam analisis regresi) atau variabel-variabel yang benar-benar mampu membedakan dua kelompok atau lebih (dalam analisis diskriminan). Dalam analisis regresi, tujuan ini dapat dicapai melalui metode backward, forward, ataupun stepwise. Dalam analisis diskriminan juga ada pemilihan variabel yang mampu membedakan kelompok (Silakan merujuk pada Buku Multivariat karangan Dillon).

Pemanfaatan analisis diskriminan dan analisis regresi biasa digunakan secara berbarengan dengan tujuan yang berbeda. Analisis regresi digunakan untuk mencari variabel-variabel prediktor yang berpengaruh terhadap variabel respon. Selanjutnya, variabel-variabel tersebut digunakan untuk membentuk sebuah fungsi pembeda (diskriminan) yang mampu mengenali perbedaan antar kelompok.

Berikut dilampirkan beberapa referensi yang dapat digunakan untuk memahami regresi dan diskriminan lebih lanjut. Semoga bermanfaat.

Referensi:

  1. analisis_korelasi-regresi-linear
  2. analisis_faktor-diskriminan
  3. analisis-diskriminan
  4. analisis-diskiminan-teori
  5. forward-stepwise-regression-procedure
  6. chapter-12-discriminant-analysis

4 Comments

  1. pak,sya dpt sran dr dsen tntg merger n akuisisi dngn mnggunakn anlsis dskrminan thdp dmpak dr mlakukn mrger n akuisisi..
    klo dbuat judul skripsi,sbaikny apa y pak klo dngn mliht sran d ats??
    n variabel apa saja yg hrus dgunakn??
    mhon bntuanny pak..
    trma ksh sblmny..

  2. pak, bagaimana dengan regresi logit, regresi tersebut kan mennggulangi kelamahan MDA/diskrimnan, sekaligus ada regresinya. cuma untuk variabel dependennya berupa kategori. maksud kategori di regresi logit tersebut apa pak?bentuk datanya seperti apa?
    tyerimaksih atas jawabannya.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s