Analisis komponen utama (principal component analysis=PCA) merupakan teknik statistik yang telah banyak digunakan. Pembahasan materi ini dapat ditemukan pada buku-buku analisis multivariat baik teori maupun aplikasi. Pemanfaatan PCA utamanya dalam menyusutkan dimensi data yang saling berkorelasi satu sama lain. Perkembangan

PCA dimulai sejak diperkenalkan pertama kali oleh Pearson pada tahun 1901. Sejalan dengan perkembangan teknologi komputer dan kemajuan di bidang matematika. PCA hingga kini masih terus mengalami perkembangan. Perkembangan selanjutnya, diperkenalkan generalisasi dari PCA oleh Loève pada tahun 1963.

Perkembangan PCA selanjutnya dipengaruhi adanya kebutuhan model PCA yang robust terhadap data pencilan (outlier). PCA klasik (CPCA) sangat dipengaruhi oleh kehadiran pencilan karena CPCA didasarkan pada matrik kovarian yang juga sangat sensitif terhadap keberadaan data pencilan. Untuk mengatasi masalah ini, matrik kovarian diestimasi estimasi kovarian yang robust dengan M-estimator (Devlin, dkk, 1975), Minimum Covariance Determinant (Rousseeuw, 1984), atau S-estimator (Croux dan Haesbroek, 1999). Ketiga metode ini baik jika digunakan untuk kasus jumlah variabel p > jumlah observasi n. Untuk kasus ini, Li dan Chen (1985) memperkenalkan robust PCA dengan Projection Pursuit (PP).

analisis-data-outlier-dgn-robpca-paper.pdf

126 Responses to “Robust Principal Component Analysis”

  1. ANGGONO HARMAN Says:

    menarik sekali

  2. Nora Lizarti Says:

    selamat siang pak….
    saya mahasiswi teknik informatika , sedang menyusun tugas akhir,.
    saya butuh referensi tentang PCA untuk judul TA saya tanda tangan digital pak..
    mohon pencerahannya pak..
    apakah bukunya tersedia.. kalo bapak ada referensinya mohon dengan sangat bantu saya.. kirimin ke email pak..
    terima kasih pak

  3. lisa Says:

    selamat pagi pak.
    saya lisa dari Yogyakarta, saya sedang mengerjakan TA tentang estimator M dan estimator S. namun saya masih kesulitan pak untuk menemukan materinya. mohon bantuannya dari bapak. jika ada apakah bisa dikirimkan ke email saya, alamat email saya lheisshyaniqta@gmail.com .
    Terima kasih

  4. ervina Selay Says:

    selamat siang pak, saya erna dari NTT. Saya saat ini sedang mengerjakan tugas akhir dengan menggunakan metode LTS namun saya kesulitan untuk mendapatkan materinya pak. jika ada yang memupnyai materi ini bisa tlong kirimkan ke alamat email saya ervina_selay@yahoo.com.
    terima kasih

  5. Intanfm Says:

    Selamat malam pak Suryana. saya mau bertanya perbedaan estimasi parameter dengan ordinary least square (OLS) dan least trimmed squares(LTS)?
    apakah Bapak mempunyai materi dan langkah kerja dari metode least trimmed squares(LTS)?? jika ada apakah bisakah tolong dikirimkan untuk saya karena saya sangat kesulitan mencari buku dan bahan referensinya mengenai metode least trimmed squares. alamat email saya intanfm.cabby@gmail.com. terima kasih banyak pak sebelumnya

  6. Amelia N.A Says:

    selamat malam Pak Suryana. Saya Amelia mahasiwi S1 Statistika. Saya ada kendala mengerjakan syntax SAS untuk skripsi saya. Saya bingung syntax SAS untuk metode Least Trimmed Square dengan data bangkitan(simulasi). Saya sudah mencoba mengerjakan syntaxnya tapi tidak muncul nilai MSEnya. jika Bapak berkenan mohon diberikan bantuan bagaimana syntax SASnya dan jika punya referensi ttg LTS mohon dikirim k email saya :
    amelia.memey02@gmail.com
    terimakasih Pak.

  7. rokhim Says:

    selamat sore pak, sya mhasiswa statistik dari Jogja, saya mau tanya pak penggunaan mcd untuk regresi linier berganda bisa gak ya pak??terima kasih pak..mohon jika berkenan Bapak bisa balas di email saya rocim08@gmail.com

  8. elis Says:

    selamat malam pak Suryana. saya mau bertanya perbedaan esrimasi parameter degan ordinary least square (OLS) dengan least trimmed squares(LTS)?
    apakah Bapak mempunyai materi dan langkah kerja dari metode least trimmed squares(LTS)?? jika ada apakah bisakah tolong dikirimkan untuk saya karena saya sangat kesulitan mencari bukunya mengenai metode least trimmed squares. alamat email saya elisse91@yahoo.com. terima kasih banyak :)

  9. ervina Says:

    selamat sore, saya Erna… apakah Bapak mempunyai materi dan langkah kerja dari metode least trimmed squares??. jika ada apakah bisa dkirimkan untuk sya karena saya sangat kesulitan mencari bukunya disini. alamat email saya ervina_selay@yahoo.com. terimaksih banyak sebelumnya.

  10. Ema Ainun Nirfianti Says:

    Selamat malam Pak Suryana. Saya Ema mahasiswi S1 Statistika Univ Brawijaya. Saya bermaksud (jika disetujui dosen pembimbing) membahas di skripsi saya mengenai penerapan robust PCA dengan menggunakan metode Projection Persuit atau menggunakan metode MVE. Kalau berkenan saya mohon bantuan Bapak mengenai apa manfaat penggunaan robust PCA ini dalam masyarakat atau lingkungan? Mengenai 2 metode tadi apa perbedaannya? Jika Bapak tidak keberatan dan memiliki informasi, referensi buku atau jurnal mohon dikirimkan ke email saya (emaainunnirfianti@gmail.com) terima kasih Pak :)

  11. Eka Irawan Says:

    selamat malam bapak, saya eka irawan mahasiswa UNUD Bali,, saya sedang mengerjakan tugas akhir saya tentang LMS dan MVE tapi saya sangat kurang literatur pak,, jika bapak memiliki file LMS dan MVE saya minta tolong dikirim,, ini email saya ekaone17@yahoo.co.id,, terimakasi atas bantuan bapak,, saya sangat butuh bantuan bapak..

  12. mukti Says:

    selamat siang pak, saya mukti…
    saya mau nanya mengenai jarak robust…
    pak kalau boleh tau, bagaimana cara jarak robust meminimumkan efek masking dan swamping??
    saya sangat butuh bantuan bapak…
    sebelumnya saya sangat berterimakasih atas bantuan bapak…

  13. IdHa DaNiel Says:

    slmt mlm,,, saya Ida d NTT,,sya mnta tlg dikirimkan master SAS ke alamt email sya ,,,sya kesulitan mendapatkanx dsni ,,email sya domy_cr9@yahoo.com,,,,trimaksh bxk…

    1. Suryana Says:

      Selamat pagi Sdri Idha, mohon maaf permintaan Sdri tidak bisa dipenuhi karena ukuran file SAS sangat besar sekali sehingga tidak mungkin dikirim by email. Terima kasih untuk kunjungannya.

  14. Sherly Celly Says:

    askum.. salam kenal bapak Suryana. Saya Sherly mhsiswi S1 statistka. Sama seperti mbak dan mas2 yang coment di atas, Skripsi saya juga Regresi robust dengan metode Least Median Square (LMS), nie saya kendala di software pengolahan datanya pak. Software yang mudah untuk olah LMS apa ya pak? Saya mau make S-Pluss, tapi bingung input rumus-rumusnya. bingung banget pak. Mungkin bapak ada referensi cara mengolah datanya atau sekiranya bisa membantu saya cara menginputkan formulanya bapak?? terimakasih.. sekira bapak ada referensi tentang LMS serta cara pengolahan data nya, saya tunggu kiriman file bapak, ini email saya pak : tyas_bakpao@ymail.com

  15. ida Says:

    pak saya mhsw dr Solo, mau tanya, kalau untuk mengestimasi parameter regresi robust untuk model non-linier apa saja metodenya? apakah sama dengan model linier berganda?

  16. wira Says:

    slm kenal pak..saya wira mahasiswa uksw jurusan matematika..
    saya mau tanya..apa PCA itu datanya harus berdistribusi normal???
    seandainya data tdk normal apa harus ditransformasi ke normal???
    terimakasih

  17. mita Says:

    assalamualaikum..
    selamat sore pak.
    perkenalkan, saya mita mahasiswa matematika UI yang sedang menyususn skripsi.
    saya mau tanya pak mengenai asumsi data pada PCA, apakah butuh asumsi normal?
    apakah data sampel yang digunakan harus banyak misalkan 10 kali dari banyaknya prediktor?
    apakah bisa mengatasi masalah missing data?

    mohon bantuannya ya pak.
    sebelumnya saya ucapkan terima kasih

  18. mukti Says:

    selamat malam pak, saya mukti…
    saya mau nanya mengenai metode minimum covariance determinant (MCD)…
    pak kalau boleh tau ap sich kelebihan MCD itu??
    apakah MCD untuk mendeteksi pencilan atau mengatasi pencilan??
    sebelumnya saya sangat berterimakasih atas bantuan bapak…

  19. ika Says:

    slmat malam pak…
    saya ika mahasiswa UNTAN.saya sedang mengerjakan tugas akhir saya tentang Metode Volume Ellipsoid untuk mendeteksi outlier tapi terkendala karena kurang literatur. boleh saya minta file kalo ada tentang MVE pak…
    kalo boleh kirimkan ke email saya di ikharimah@ymail.com.
    terima kasih atas bantuan bapak…

    1. Suryana Says:

      @ ika: Sebelum saya mnegirimkan file MVE, referensi apa yang sudah Ika punya?

  20. mukti Says:

    met siang pak…
    saya mukti yg dulu pernah minta file dengan bapak…
    saya mau nanya pak??
    apa bedanya Minimum Covariance Determinant dengan Least Median Square??

  21. hufron Says:

    pak minta tolong untuk ajari saya tentang regresi LMS metode robust ….

  22. hufron Says:

    ass..
    pak punya script tentang regresi robust dengan menggunakan metode LMS … krim aja ke alamt saya …. hufron1987@gmail.com
    maksih pak

  23. rene Says:

    mau nanya nih pak,kegunaan robust pca untuk data outlier apa sih? setelah mengidentifikasi outlier dengan fast mcd,data yang kita olah dengan metode robust pca apakah data yang tdk mengandung outlier, dan data yang mengandung outlier itu kita buang??? maaf pertanyaannya enggak absurd!! pemula sih….

  24. Ory Ade Maulana Says:

    asmlkum pak..
    saya sedang nulis skripsi ttg regresi robust dengan menggunakan metode LTS..
    boleh minta referensi nya gk pak ttg LTS..
    terima kasih pak buat bantuannya..
    ini alamat imel sy.. juventus_3131@yahoo.com

  25. endah Says:

    Salam kenal pak,
    saya ingin menanyakan mengenai metode robust dengan penduga MM. Mengapa menggunakan estimasi LMS atau LTS atau S dalam menduga koefisen awal baru metode M. kalau bapak mempunyai jurnal beserta contoh data mengenai materi ini mohon bantuannya ya pak.. Terimakasih

  26. hana Says:

    met malem pak mw tanya pengolahan robust estimasi-mm dengan program S-plus.bapak punya programnya tidak.saya kesulitan mendapatkan programnya.kalo ada kirim di email saya ya pak

  27. ulie Says:

    selamat siang Pak
    wah,blok yang sangat menarik,sudah benyak rekan-rekan mahasiswa statistika yang comment di blok ini ya Pak?saya jadi tertarik ikut jejak mereka Pak..hehe
    saya aulia mahasiswa S1 statistika di unibraw yang juga sedang menyelesaikan tugas akhir,tema yang saya ambil mengenai robust pls dengan penduga M atau biasa disebut Partial robust M regression (PRM) untuk data mengandung outlier,,nah yang saya bingungkan pada pendeteksian outlier pak,saya mendapatkan dari jurnal outlier untuk robust pls itu jika outliernya terletak pada skor komponen (T),tapi ada juga jurnal lain mengatakan jika outlier terletak pada variabel x atau y..saya bingung disitu Pak..
    terima kasih jika bapak bersedia membantu mengatasi kebingungan saya..:-P

  28. Lia Says:

    Assalamualaikum bpak Suryana,.perkenalkan nama saya Lia mahasiswa statistik di Jogja.Menarik sekali blog bapak..Kebetulan saya juga sedang mengambil tugas akhir dengan tema robust PCA (alhamdulilah dosen pembimbing sudah setuju).Saya mendapatkan kesulitan pak dalam hal materinya,.saya hanya punya sedikit sekali referensi.Mohon bapak bersedia memberikan materi2 yang bapak punya tentang PCA,robust PCA atau mungkin dari thesis bapak sendiri. Satu lagi bapak saya juga belum menemukan data yang bisa dianalisis dengan robust PCA (data outlier).Mohon bantuannya pak untuk materi2nya beserta data.
    Terima kasih atas kebaikan bapak,..Nuwun.

    Salam

    Lia

  29. Lia Says:

    Assalamualaikum bpk Suryana,..menarik sekali pak blognya.Perkenalkan nama saya Lia mahasiswa prodi statistik di jogja.Saya ingin mengambil skripsi (alhamdulilah pembimbing sdh megizinkan) tentang robust PCA,.dan saya mengalami kesulitan dalam materi sekaligus datanya.Mohon sekiranya bapak bersedia mengirimkan materi2 yang menyangkut robust PCA,paper/tesis bapak atau materi2 lain yang bapak punya.Dan satu lagi pak,.saya juga sulit untuk mendapatkan data yang bisa diolah dengan robust PCA serta PCA.Seperti yg bapak sampaikan di atas,saya juga ingin membandingkan antara PCA dan robust PCA.Mohon bantuan dan bimbingannya yaa bapak,..Terimakasih.Nuwun

  30. griya Says:

    maaf pak,
    saya Griya Dari UNS
    saya tertarik dengan regresi Robust dengan penduga S..
    tapi datanya mengandung Multikolinearitas,
    apakah menanganinya dengan ROBPCA juga?

    kalau menggunakan yang S-estimator itu bedanya apa ya pak?
    trimakasih

  31. kurnia Says:

    mf pak saya mhsswi di Jogja.
    saya sedang membahas tentang reg robust dengan estimasi LMS.
    apakah bpk punya referensi tentang LMS?
    kalau punya tolong kirim ke email saya
    lina.kurnia07@gmail.com
    dan kalau bpk punya software Splus tolong saya dikirimi jg.
    terimakasih atas bantuannya..

  32. lina Says:

    pak, saya mahasiswi UNY.saya sedang mengerjakan TA tentang regresi robust.
    saya kesulitan mecari bahan tentang estimasi S dan LMS.saya mohon bapak dapat bersedia membantu saya.
    tolong kirimkan referensi yang bpk punya ke:
    lina.kurnia07@gmail.com
    dan juga kalau bapak mempnyai software Splus tolong kirimkan juga.
    terimakasih sebelumnya pak.

  33. yanti Says:

    aslm, pak saya yanti mahasiswi yang sedang TA, tolong pak bantu saya, saya butuh file tentang robust, least median squares, least trimmed of squares, dan penjelasan dari bapak.

    terimakasih bapak atas bantuannya..

  34. dini Says:

    pak, saya mahasiswi unpad yang sedang mengerjakan tugas akhir, tugas akhir saya memperbandingkan metode analisis regresi komponen utama robust yaitu
    MVE-LMS dan MVE-LTS
    saya kesulitan mencari bahan2 tersebut,
    saya mohon beberapa referensi yang bapak punya dapat di emailkan ke dini_aderlina@yahoo.com

    terimaksaih atas bantuan bapak..

  35. azah Says:

    salam
    pak sy mau tanya, sy kurang begitu faham ttg langkh2 m estimasi, n dalam m estimasi ada yg namanya fungsi2 ukuran robust gunanya untuk apa? dan apakah m estimasi bs diselesaikan dengan bantuan MINITAB.mohon penjelasannya…makasih

  36. amilah Says:

    saya mau tanyakan tentang Least Trimmed Square… apa bpk punya referensi mengenai ini?
    trus bgm hubungannya dengan robust…
    mohon penjelasannya…
    terima kasih

  37. rene Says:

    ass.wr.wb.
    pak sy ingin tanya apakah data Indeks harga konsumen (IHK) bisa saya gunakan pada metode ROBPCA untuk mengatasi pencilannya??

  38. rene Says:

    Ass.wr.wb.
    Saya mau tanya pak apakah RObust PCA pada data Indeks Harga konsumen bisa digunakan untuk mengatasi pencilan?

  39. indah Says:

    ass.wr.wb.
    maaf pak, saya mau tanya..
    tapi mungkin agak sedikit keluar dari ROBPCA.
    saya mahasiswa yang sedang mengerjakan skripsi dan salah satu pengolahan datany menggunakan faktor analisis dg SPSS 14.
    salah satu syarat faktor analisis, data harus berupa interval.
    tapi pada ekstraksi faktor, menggunakan pilihan principal component analysis yang bisa digunakan untuk data ordinal juga.

    kalau seperti itu, jadi sebaiknya data ordinal harus diubah dulu menjadi interval atau tidak ya pak sebelum dilakukan analisis faktor?
    mohon bantuannya dan terima kasih atas bantuannya pak..

  40. susi Says:

    salam kenal.pak, saya mau tanya apa perbedaan regresi robust dengan m estimasi dan LMS serta Rank residual? manakah dari ketiga estimasi tersebut yang lebih baik?trimakasih.

    1. Tria Says:

      salam kenal pak.saya mau tmy, apakah kelemahan dari regresi robust dengan penduga S, M, dan MM??
      mohon informasi yg lengkap y pak!!
      krn ini d buat acuan bhn skripsi yg sedang saya kerjakan.terimakasih.

  41. wahyuna Says:

    maaf pak , saya mau tanya pada paper bapak tentang analisis data outlier pada pengeluaran rumah tangga dengan metode robust PCA digunakan data pengeluaran rumah tangga, yang saya tanya data seperti apa saja yang bisa dipakai untuk metode robust PCA selain pengeluaran rumah tangga?

  42. mufti fuad Says:

    Assalam…
    maaf pak bisa minta tolong saya kurang paham dengan robust m-estimasi jadi bisa kirimkan contoh study kasus regresi robust dengan M-estimasi dengan analisisnya, mohon bantuannya
    trimaksih sebelumnya,,,,,,,,,,,,,,,,,,

    1. pitri Says:

      aslm. mf, saudara mufti lagi nysun Skripsi tentang M estimator???

      1. mufti fuad Says:

        iya betul…..
        tapi lagi kebingungan dengan bahan bahannya……

        maaf mbak juga nyari m estimator y??

      2. mufti fuad Says:

        maaf lagi mbak
        kalo ada bahan2 ato referensi tentang m estimator sya minta tolong share ke email saya ya mbak
        di mufti_fuad@yahoo.com
        terima kassih sebelumnya……..

      3. mojangtauco Says:

        waktu tu sm pak suryana dikasih buku marona. udah punya blum???di buku montgomery juga ada.

  43. ita Says:

    Pak, maaf. Saya pernah membaca thesis Bapak. Disitu dituliskan bahwa untuk data yang jumlah sample<variabel, akan lebih baik menggunakan MCD, M-estimator, atau S-estimator. Apakah dalam hal ini PCA klasik tidak bisa digunakan?apa prasyarat untuk penerapan ketiga metoda tersebut?bagaimana saya harus memilih mana yang tepat digunakan untuk suatu data?terima kasih banyak Pak sebelumnya. mohon bantuannya karena data thesis saya memiliki karakteristik seperti itu dan tidak dapat dioperasikan dengan SPSS dengan metoda PCA klasik. Maaf apabila pertanyaan saya terlalu dangkal, karena saya termasuk newcomer dalam statistik.terima kasih.

  44. pitri Says:

    aslm. Pak, klo ngolah data LTS dan M estimator pake S-PLUS atau SAS???

    1. Suryana Says:

      Untuk LTS Robust Regression, Fitri bisa mengolahnya dengan SAS 9.0 dengan memanggil PROC ROBUSTREG. LTS bisa juga diolah melalui S-Plus dengan ltsreg procedure.

      Untuk M-Estimation Robust Regression, Fitri dapat menggunakan R dengan mengaplikasikan fungsi rlm (robust linear model) dalam MASS library. Terima kasih.

      1. pitri Says:

        Aslm. Pak, sy mau nanya lagi. KLo untuk pembahasan mengenai robust (M dan LTS estimator) harus ada pembahasan mengenai Multikolinearitas, Autokorelasi, Hteroskedastisitas gak pak???ditunggu jawabannya secepatnya.trims

      2. pitri Says:

        truz klo di studi kasusnya perlu dibahas tentang metode OLS gak pak?atau cukup ngebahas metode robustnya aja?

      3. pitri Says:

        pak, bisa tolong dijelaskan kenapa metode robust tidak bisa dilakukan uji F atau t, karena harus mmenuhi distribusi identik dan independen.Truz pemilihan model terbaiknya gmn caranya??Waktu saya baca jurnal ada AICR, BICR, dan RFPE itu maksudnya apa????mohon penjelaasannya. trims

    2. pitri Says:

      aslm. pak, saya mw minta algoritma (syntax) SAS 9.0 untuk pengujian pengamatan berpengaruh(DFFITS, DCOOKS)???Saya gtau pak.trims.ditunggu jawabannya….

  45. Mukti Kurniadi Says:

    aslm.pak, mohon bantuannya, ad file tentang metode robust Least Median Square(LMS), Least Trimmed Square (LTS),Minimum Covariance Determinant (MCD), Minimum Volume Elipsoid (MVE)klo ad tlg kirim k email sy y pak??? file di atas rencana untuk tgs akhir saya.
    besar harapan saya klu file ny ad.
    saya sangat berterima kasih banyak klu bpk bs mengirimkan file tersebut.

    1. Mukti Kurniadi Says:

      terima kasih banyak pak…
      fileny udh nyampai…

      1. dini Says:

        saya juga butuh file2 di atas pak.. mohon dapat dikirim ke email saya
        dini_aderlina@yahoo.com
        terimakasih pak..

      2. mukti Says:

        dini: file ny udh di kirim oleh pak suryana belum??

      3. Ema Ainun Nirfianti Says:

        boleh saya minta file nya juga? emaainunnirfianti@gmail.com
        terima kasih sebelumnya

  46. pitri Says:

    aslm. Pak, ini pitri yang pernah minta file2 tentang metode robust LTS dan M estimator. Skrg sy mw minta bantuan bpk lagi. sy mw minta data yang ada pencilannya yng bisa diolah menggunaan metode LTS dan M estimatr, ada g pak datanya????klo ada tlg kirim ke email sy y pak??besar harapan saya kiranya bpk mw membantu sy lg. Jazakallah…

  47. pitri Says:

    aslm. Pak, ini pitri yang pernah minta file2 tentang metode robust LTS dan M estimator. Skrg sy mw minta bantuan bpk lagi. sy mw minta data yang ada pencilannya yng bisa diolah menggunaan metode LTS dan M estimatr, ada g pak datanya????klo ada tlg kirim ke email sy y pak??besar harapan saya kiranya bpk mw membantu sy lg. Jazakallah…

  48. pitri Says:

    aslm.pak, file yg bpk kirim ke email sy cuma ada “Radical M estimator corelation and rgression” klo file ttg LTS nya blum dikirim y pak?mksh

    1. Suryana Says:

      Waalaikum salam, Fitri. Referensi LTS sudah Saya kirimkan via email. Terima kasih.

      1. pitri Says:

        aslm. iya pak udah nyampe kirimn file2nya di email sy. Jazakallah khoiron katsiro atas kebaikan bpk.

      2. Suryana Says:

        @ Fitri: Sama-sama.

  49. andi Says:

    pak,,, mohon bantuannya… saya ingin mengolah data dengan menggunakan LIBRA dengan Matlab R2009a bisa tidak?

  50. pitri Says:

    aslm. mf pak, file CD tentang Robust M estimator dan LTS estimator udah dikirim k almt kmpus sy blum?soalnya di kampus blum ada paket kiriman dari bpk.mf pak…mksh.

  51. wahyuna Says:

    asl.maaf pak program matlab dan splus yang bbapak kirim lewat email belum masuk di email saya bisa dikirim ulang! terima kasih sebelumnya untuk penjelasan tahapan ROBPCAnya Pak.

  52. pitri Says:

    aslm. Pak, sebenarnya untuk membandingkan dua buah model yang PALING robust antara LTS dan M estimator itu dilhat dari apanya??trims

    1. Suryana Says:

      Menurut hemat Saya, Pitri sedang meneliti efek penggunaan metode estimasi robust LTS dan M terhadap pemodelan. Jadi, ukurannya buka pada metode mana yang paling robust tetapi metode mana yang mempunyai efek terhadap pemodelan yang terbaik. Jadi, ukuran kinerja metode tersebut bisa dilihat dari model mana yang mengasilkan error terkecil atau metode mana yang menghasilkan pelanggaran model paling sedikit (multikolinearitas, autokorelasi, dsb). Ukuran tingkat kerobust-an sendiri bisa dilihat dari besaran breakdown value masing-masing metode, tingkat konvergensinya (cepat atau lambat), MSE, dll.

  53. Ummi Says:

    Pak, sy mau tanya tentang aplikasi PCA untuk pengelompokkan kemiripan data pakai pemrograman matlab trus diplot gambarnya.
    secara analitis sy th langkah2nya :
    1. masukkan data dalam bentuk matriks
    2.kurangi masing-masing data dengan rata-rata dari set data tersebut
    3. hitung matriks kovarian dari set data tersebut
    4.hitung eigenvalue dan eigenvektor dari matriks kovarian
    5.pilih eigenvalue kemudian hitung matriks feturePCA
    transformasi data awal menjadi data final.

    tapi untuk pemrograman di matlab sy blm bs. mohon petunjuknya via email. trkmsh

    1. Suryana Says:

      @ Ummi: Trims tuk kunjungannya di statistikaterapan. Ummi bisa menggunakan program robpca yang disimpan dalam folder LIBRA. Baca dan ikuti langkah-langkah pengolahan Robpca yang ada di blog ini. Untuk diketahui rob pca selain bisa mengolah PCA robust juga bisa mengolah PCA klasik. Ummi juga bisa mengolah PCA di SPSS, Matlab atau Software statistik yang lain.

  54. wahyuna Says:

    pak saya mau bertanya, saya mengangkat paper anda tentang ROBPCA sebagai tema skripsi yang saya susun, tapi saya agak bingung dalam tahapan ROBPCA ini, apa yang pertama harus saya cari? apakah menentukan datanya dulu outlier atau tidak? karena saya agak bingung waktu membaca paper ini, kalau bisa tolong jelaskan secara rinci tahapan analisis data outlier ini dengan menggunakan metode ROBPCA? lalu metode apa yang digunakan untuk menentukan data outliernya?

    1. Suryana Says:

      @ Wahyuna: Izinkan Saya menjelaskan jawaban dari pertanyaan Sdri. Tahapan analisis Robust PCA yang pertama adalah mengidentifikasi data apakah data yang akan kita kaji mengandung sejumlah outlier atau tidak. Metode penentuan data outlier dalam hal ini dengan menggunakan robust distance yang distribusi asymptotiknya mengikuti distribusi chi-square. Dalam papernya Hubert (2004) disebutkan bahwa data multivariat dikatakan outlier apabila melebihi batas chi-sguare dengan tingkat signifikansi 95 persen. Secara grafis, data outlier ini akan berada di luar ellips yang terbentuk. Dengan terbentuknya sekelompok data outlier ini kita dapat mengkaji jenis data outlier yang terbentuk apakah termasuk kategori shift outlier, scale outlier, atau radial outlier.
      Data shift outlier mempunyai ciri berbeda dengan data tidak outlier dalam hal rata-ratanya saja, scale outlier berbeda dalam hal varians kovariannya dan radial outlier berbeda dalam hal keduanya baik rata-rata maupun varian kovariannya.
      Setelah data outlier teridentifikasi barulah kita aplikasikan Robust PCA dan Klasik PCA untuk diketahui perbedaan kinerja dari kedua metode PCA tadi. Mana yang menghasilkan sedikit komponen untuk penjelasan varian data yang maksimal. Dalam paper saya dicontohkan bahwa metode robust pca menghasilkan sedikit komponen untuk penjelasan varian data yang sama dengan PCA klasik.

  55. andi Says:

    pak, cara menggunakan ROBPCA di Matlab bagaimana?bisa jelaskan…
    saya sudah membaca, artikel bpak ttg mengolah data dengan robpca tapi, tidak bisa…

    1. Suryana Says:

      @andi: Kalau tahap demi tahap diikui, Insya Alloh Andi bisa mengolah robust pca.

      1. andi Says:

        saya mau tanya, x pada data diganti ya???bagian apa saja dari algoritma robpca.m yang harus diganti?

  56. andi Says:

    pak, saya kesulitan utk mendapatkan software matlab, selain matlab adakah software lain untuk ROBPCA?

  57. Tommy Says:

    Mohon maaf pak, Saya mahasiswa univ. Tarumanagara yang sedang menyusun tugas akhir berkaitan dengan 7 metode regresi. Salah satunya tentang regresi clasic PCR. Mohon bantuan bapak untuk menerangkan bedanya dengan ROBPCA yang bapak terangkan dimana..? Apa bedanya metode ROBPCA tadi dengan metode robust with minimum covariant determinant (keunggulan / kelebihan)?

  58. wahyuna Says:

    saya sudah mencoba mendownload program matlab untuk ROBPCA tapi belum berhasil . mohon bantuannya pak!

    1. Suryana Says:

      Robpca versi s-plus dan matlab telah Saya kirim via email. Selamat mencoba!

      1. yuliani Says:

        Mohon bantuan ya,,,saya juga sudah mencoba mendownld program matlab untuk ROBPCA tapi belum berhasil,,,bsa gak saya mta tlg untuk dikirimkan programnya???

  59. pitri Says:

    oh iya pak, sebenarnya pengertian robust itu sendiri apa sih????

    1. Suryana Says:

      @pitri: Robust kalau dibahasa Indonesiakan artinya “tegar” dalam arti tidak terpengaruh oleh kehadiran outlier. Estimator Robust bermakna kokoh dalam mengestimasi baik ada outlier maupun tidak ada outlier.

      1. pitri Says:

        aslm. pak, terima kasih buku maronanya yg dah dikirim ke email. tp tidak bisa dibuka.heheheee. gmn atuh pak???mksh jg sebelumnya udah mw ngirimin file2 LTS dan M estimator. Ditunggu y pak..

      2. Suryana Says:

        @pitri: Maaf atuh…. kirain sudah bisa dibuka filenya. Ya udah referensinya dikirim via CD aja.

      3. pitri Says:

        aslm. mf pak,,,,setelah dicoba2 ternyata bisa dibuka filenya. mf y pak…trims.

    2. pitri Says:

      aslm.pak, file yg bpk kirim ke email sy cuma ada “Radical M estimator corelation and rgression” klo file ttg LTS nya blum dikirim y pak?mksh

  60. pitri Says:

    berhubung sy anak kosan, sy kirimkan alamat kampus sy. Gedung FPMIPA Universitas Pendidikan Indonesia (UPI) jalan dr setiabudhi no.229, bandung.atas nama PITRI NURHAYATI Nim 060039 Jurusan Pendidikan Matematika, Prodi Matematika.
    Judul skripsi sy, Penggunaan Metode robust dalam menaksir parameter regresi . tapi isinya perbandingan model penaksir LTS dan M

    1. Suryana Says:

      OK, ditunggu kiriman referensinya !!!

  61. vera Says:

    pagi pak…
    saya vera, mau bertanya, untuk robust principal component analysis sebenarnya ada berapa metode, dan metode mana yang paling baik…
    terimakasih

  62. vera Says:

    pagi, pak..
    saya mau minta tolong,,, saya baru membaca tentang ROBPCA… dan tertarik untuk menjadikannya sebagai bahan TA…
    boleh tidak saya minta beberapa data untuk saya bisa pakai dengan metode ini…
    terima kasih sebelumnya…

  63. pitri Says:

    mf pak sy mohon bantuannya. sya lg nyusun tugas akhir tentang perbandingan antara metode LTS dan M estimator. Sy mw minta tolong dikirimkan file-filenya pak. sy kekurangan referensi. Truz, menurut bpk..bagus gak judul TA sy??apa kelebihan dan kekurangan dari metode tersebut.trima kasiih

    1. Suryana Says:

      @ V3: Referensi yang dimaksud V3, Insya Alloh Saya memepunyai beberapa referensi yang sangat relevan. Berhubung filenya besar silakan kirimkan alamat rumah/kampus untuk Saya kirimi referensi dimaksud dalam bentuk CD. Soal judul….. belum jelas apanya yang akan dibandingkan apakah kinerja estimatornya atau perbandingan kerobust-annya atau apa?

  64. eno Says:

    selamat malam pak….perkenalkan nama saya seno. saya lg mengerjakan skripsi saya yang berjudul analisis regresi robust dgn metode LMS, yang saya mw txkan metode apa yang trbgus untuk mendeteksi penclan dan apa alasanya? serta metode apa yang bsa saya gunakan untuk mendeteksi pencialn y berpengaruh untuk variabel berganda?selain permsalahn itu saya jg msh sgt kkergan refrensi ttg regresi robust dengan metode LMS??kl ada refrensi bsa tlong krimkan via email??trmksh seblumnya

  65. Lina Says:

    salam kenal, saya Lina mahasiswi Universitas Mulawarman Samarinda. saya sekarang sedang menulis skripsi tentang Analisis Diskriminan Robust dengan metode MCD(Minimum Covariance Determinant),, Yang saya ingin tanyakan, bisa kah saya meminta penjelasan atau gambaran umum mengenai analisis diskriminan robust dengan metode MCD tersebut????
    Terima kasih.

  66. eri Says:

    Selamat malam

    Salam kenal, saya eri mahasiswa di Statistika UNPAD. pa, bisa tolong jelaskan alasan mengapa kita harus menggunakan PCA dan Analisis Faktor?
    Lalu mana yang lebih baik digunakan (perbandingannya)bila kita ingin melihat faktor-faktor mana yang lebih berpengaruh..?

    Apa bapa mengetahui web yang menjelaskan perbandingan PCA dan Analisis Faktor

    1. Suryana Says:

      PCA dan Analisis Faktor merupakan dua teknik analisis yang berbeda. PCA mereduksi variabel yang saling berkorelasi dengan membentuk variabel baru yang merupakan kombinasi linear dari variabel yang lama. Sebaliknya, faktor analisis mencari faktor umum (general faktor) yang membangkitkan variabel itu sendiri. Dengan demikian, untuk mencari fator-faktor umum yang medasari suatu variabel sangat cocok jika menggunakan analisis faktor.

  67. widya Says:

    selamat sore dan salam kenal..
    saya mahasiswi Statistika IPB. saat ini saya sedang mulai menyusun skripsi tentang robust principle component. beruntung sekali saya menemukan situs ini..=)

    1. Suryana Says:

      Selamat bergabung di peminat robust PCA. Jika ada yang akan didiskusikan, jangan sungkan untuk melayangkan diskusi melalui blog ini atau via email. Tks.

  68. ria Says:

    salam kenal, saya ria mahasiswa brawijya. saya sekarang sedang menulis skripsi tentang robust principal component regression (RPCR). yang saya ingin tanyakn. kenapa qta mesti melakukan regresi robust, padahal pencilan sudah tertangani pada PCA robust? alasan mengapa menggunakan regresi komponen utama? knapa tidak menggunakan regresi linier berganda biasa saja. terima kasih.

    1. Suryana Says:

      To Ria…. thanks buat kunjungannya. Saya belum membaca jurnal RPCR. Tetapi sekilas bisa saya jelaskan tujuan masing-masing dari dua metode dalam RPCR. Ada kemungkinan variabel independen dalam model masih saling berkorelasi. Padahal, regresi berganda mensyaratkan tidak ada korelasi di antara variabel independen. Untuk mengatasinya kita gunakan principal component karena dengan principal component variabel independen yang saling berkorelasi bisa direduksi menjadi sejumlah variabel yang saling dependen (bebas).
      Robust statistik bertujuan agar estimasi parameter dari model regresi tidak dipengaruhi oleh sejumlah data yang bersifat pencilan. Dengan Robust Principal Component data-data yang bersifat pencilan tersebut tidak akan disertakan dalam penghitugan estimasi rata-rata dan kovariansi data. Dengan langkah ini diharapkan pemodelan regresi menjadi lebih resisten terhadap data outlier (pencilan). Demikian Ria, kalau tidak keberatan… minta tolong jurnal RPCR dikirimkan ke email suryana@bps.go.id untuk menambah wawasan perstatistika Saya. Terima kasih.

  69. yudi Says:

    perkenalkan nama saya yudi….saya tertarik dengan regresi robust dan ingin membahas materi ini di skripsi saya..pak surya punya ide ga??

    1. Suryana Says:

      To: Yudi,
      Saran saya, coba Yudi eksplorasi data lebih dulu. Apabila ada sejumlah data outlier dan Yudi ingin meneliti hubungan dua variabel, maka regresi robust bisa digunakan. Tetapi jika, tidak ada data outlier maka regresi biasa cukup Yudi gunakan. Demikian.

  70. Ajeng Says:

    ok… terimakasih atas ilmunya..

  71. nelly Says:

    bs jelaskan, pa sich M-Estimator & S-Estimator tu???

    Llu prbedaanny pa diantara kedua estimasi tsb???

    Fungsi kedua estimator tsb pa???

    thx b4

    1. Suryana Says:

      Untuk persamaan antara M dan S estimator, sama-sama digunakan untuk mengestimasi reta-rata dan kovariansi data yang mengandung outlier. Perbedaannya terletak pada tingkat robustnessnya. Seingat saya, S-estimator lebih baik dari sisi breakdownt point dan konvergensinya. Secara teknis perhitungannya, sebaiknya merujuk pada jurnal yang membahas kedua estimator ini.

  72. ajeng Says:

    mau tanya,, apakah sesuai jika saya menggunakan regresi robust untuk meneliti hubungan antara data curah hujan dengan temperatur dan data pasang surut? kalo tidak sesuai, metode apa yang sesuai?
    lalu jika ingin mengetahui distribusinya bagaimana? terimakasih..

    1. Suryana Says:

      Menurut Saya, untuk menetukan model apa yang sesuai untuk pemodelan curah hujan, temperatur dan pasang-surut sebaiknya Ajeng membuat scatterplotnya dulu. Dari langkah ini, jika plotnya menunjukkan pola tertentu semisal linear, kuadratik, atau kubik silakan gunakan analisis regresi (sesuaikan dengan bentuk plotnya). Jika data mengandung pencilan, baru kita gunakan regresi robust. Tetapi, jika plot data tidak berpola, Saya sarankan gunakan regresi nonparametrik. Model akan menyesuaikan bentuk plot data.

      Untuk mengetahui bentuk distribusi data, Ajrng bisa memanfaatkan Minitab. Pada salah satu menu terdapat fungsi untuk mencari bentuk distribusi data. Demikian, semoga bermanfaat.

  73. revan Says:

    salam kenal pak surya,saya revan mahasiswa fapet ipb,..saya ingin mempelajari PCA yg aplikasinya untuk bidang peternakan..saya tidak begitu paham dengan statistik..jd dimana(referensi) saya bisa belajar PCA ini sebagai orang awam..mohon bantuannya.
    terimakasi

  74. nisya Says:

    perkenalkan saya anisyah anak matematika ugm yang mendalami statistik…..Saya pernah mencoba paper / jurnal yang bapak pernah rekomendasikan untuk menggunakan toolbox libra untuk metode robpca………pas saya coba koq banyaknya principal components yang muncul cuma max 10…… pa mang gitu yachhhhhh…………tidak bisa diperbanyak kah??????????
    Trima Kasih………….

  75. rizka Says:

    Ass.
    bisa minta tolong dijelaskan perbedaan antara MCD dan FAST-MCD dari rumusnya

  76. ianrambe Says:

    Pagi pak…Pak, tehnik PCA ini katanya hanya bagus untuk data linear. Kalau untuk data non linear lebihj bagus pake tehnik apa ya pak?
    Terimakasih…

  77. sri Says:

    selamat pagi pak…saya mau tanya apa ROBPCA ini sudah ada program aplikasi untuk membantu menghitungnya tidak? soalnya saya sedang mencari teori statistik yang bisa saya buat programnya untuk skripsi saya. Terima kasih

    1. Suryana Says:

      Program Aplikasi yang ada adalah Matlab. Itupun dengan menambahkan Toolbox LIBRA dari Hubert. Sri bisa googling. Pasti dapet. Jika tidak, Saya bisa kirimkan via email tanggal 15 Desember 2008. Terima kasih.

  78. RIRIN Says:

    Selmt malam.Bapak Suryana saya mohon bantuan lagi, saya membutuhkan beberapa data (5 data) yang dapat dianalisis dengan metode ROBPCA, jika Bapak mempunyai beberapa data tersebut, mohon saya diizinkan untuk memakainya sebagai penerapan pada skripsi saya. Saya mencoba menggunakan softwere S-plus6 untuk melakukan analisis tersebut.Terima kasih atas bantuan Bapak sebelumnya, karena hal tersebut sangat membantu saya dalam menyelesaikan skripsi saya.terima kasih.

  79. suryana Says:

    Jawaban Untuk Sdri Tiwik:

    ROBPCA digunakan untuk mereduksi dimensi data dengan Principal Component Analysis dari data yang mengandung sejumlah outlier. Merobust-kan data artinya bisa bermakna menganalisis data dengan tidak menyertakan data outlier. Dalam ROBPCA misalnya, Hubert dkk menggunakan MCD untuk merobustkan rata-rata dan matrik varians-kovarians. Caranya dengan mengambil sebagian data di mana determinant matrik varians-kovarians terkecil. Dengan algoritma FAST-MCD menjadikan pencarian rata-rata dan matrik varians-kovarians dengan metode MCD menjadi cepat dari sisi waktu komputasi.

    Untuk pengolahan ROBPCA bisa menggunakan Matlab ataupun S-Plus. Hubert dkk telah menyusun LIBRA yang merupakan kumpulan source program Matlab untuk penghitungan robust statistik. Toolbox ini bisa diunduh di

    http://wis.kuleuven.be/stat/robust/LIBRA.html

    Jika ada kesulitan pengoperasiannya, bisa menghubungi kembali melalui site

    http://www.statistikaterapan.wordpress.com.

    Terima kasih.

  80. suryana Says:

    Jawaban untuk Ririn di Unibraw,

    Untuk mengetahui suatu data multivariat mengandung outlier atau tidak bisa melalui pendekatan jarak robust. Jarak robust merupakan modifikasi dari jarak mahalanobis dengan menggantikan unsur vektor rata-rata dan matrik varians-kovarians (klasik) dengan rata-rata dan matrik varians-kovarians yang menggunakan metode robust seperti MCD. Data multivariat dikatakan outlier jika melebihi jarak robust pada alpha yang ditentukan. Distribusi dari jarak robust mendekati distribusi chi square pada alpha tertentu. Pembahasan mengenai ini bisa mengacu pada tulisan Hubert dkk mengenai Multivariate Robust.

    Sewaktu saya menyusun thesis, Hubert dalam proses penyusunan buku. Adapun Hubert (2004) masih berupa journal. (Journal dan Papernya masih saya cari, kalau sudah ketemu ta kirim ke Sdri Ririn via email).

  81. Tiwik Says:

    Salam kenal, P’Sur, saya berminat sekali dg ilmu statistika walaupun background saya dari ekonomi. Baru-baru ini saya dengar istilah Robust PCA (ROBPCA). Katanya utk data yg banyak outlier-nya & sulit untuk di normal-kan … betul ya Pak? Saya ingin tahu, kalau data kita di-robust, apa itu maksudnya data kita itu ditransformasi dg formula semacam z-score, tapi mean diganti dg m-estimator dan std deviasi diganti dengan interquartile range? Aplikasi ROBPCA di SPSS bgm ya? Help me ya Pak, soalnya utk yg spt ini saya betul-betul ‘buta’. Saya sdh coba baca jurnalnya Hubert, Croux, Rouseeuw dll, tapi yg ada saya malah semakin bingung berat, soalnya itu rumusnya cukup asing buat saya. Trims banyak.

  82. ririn Says:

    slmt siang…!saya ingin tanya, bagaimana kita tau suatu data multivariat mengandung pencilan metode inferensia/kuantitatif? ?menurut Anda, saya sebaik’y menggunakan metode Stahel Donodo /MCD untk mengts pencilan? saya mencr bk kargn Hubert (2004) d.perpuz UNIBRAW tdk ada,di mn sy bs memprlh bk itu ya?terima kasih

  83. Suryana Says:

    Salah satu referensi statistik robust bisa Sdri Ririn download di
    wis.kuleuven.be/stat/robust/Papers/robpca.pdf

    Referensi lainnya yang penting adalah:

    http://wis.kuleuven.be/stat/robust/LIBRA.html

    karena memuat program pengolahan robpca oleh Hubert (2004).

    Masih di site yang sama, Sdri dapat menemukan referensi lain mengenai robust statistik.

    Semoga, jawaban ini membantu Sdri.

    Terima kasih.

  84. ririn Says:

    Salam kenal,saya adlh mhswi statistika Univ.Brawijaya.Saya tertarik dgn paper yg saudara berkaitan dengan ROBPCA terkait dengan pencilan data.Saya terinspirasi dengan paper tersebut, sehingga saya mengambil judul skripsi yang berkaitan dengan ROBPCA terhadap pencilan data.Jika Saudara mempunyai jurnal atau referensi buku yang berkaitan dengan ROBPCA,mohon Saudara berkenan untuk memberikan informasi kepada saya, untuk membantu penyelesaian skripsi saya (ri2n_medy@yahoo.com).Terima kasih.

  85. Suryana Says:

    Trims tuk kunjungannya. Salam perkenalan. Robust Principal Component Analysis (RPCA) merupakan pengembangan dari Principal Component Analysis (PCA) klasik. Apa bedanya? Penurunan komponen pada PCA klasik berbasis pada estimasi rata-rata dan kovariansi dengan metode Maximum Likelihood Estimator (MLE). Ada kelemahan penggunaan metode MLE. Pada saat data mengandung sejumlah outlier, sejumlah data yang berasal dari distribusi yang berbeda dengan distribusi data asal, rata-rata dan kovariansinya tidak resisten. Sebagai contoh, Haniaty mempunyai data 1,2,3,4,dan 5. Rata-rata kelima data ini adalah 3. Seandainya data ketiga kita ganti dengan 100 (sebagai contoh outlier) maka rata-rata menjadi 22,4 sangat berbeda dengan rata-rata sebelumnya. Inilah contoh bahwa rata-rata dengan metode MLE tidak resisten terhadap keberadaan data outlier. Sebagai ukuran tingkat resistensi suatu metode terhadap keberadaan outlier digunakan breakdownpoint. Breakdownpoint untuk rata-rata adalah 1, artinya dengan hanya menggantikan 1 nilai ektrim pada data asal maka akan didapati perubahan rata-rata yang sangat besar.
    Untuk mengatasi kelemahan PCA klasik, digunakanlah RPCA yang menggunakan metode estimasi untuk rata-rata dan kovariansi data dengan metode yang resisten terhadap keberadaan outlier. Salah satu metode yang digunakan adalah Minimum Covariance Determinant yaitu suatu metode yang mengestimasi rata-rata dan kovariansi data dengan menggunakan sebagian data yang menghasilkan determinan kovariansi terkecil. Penggunaan MCD dalam PCA telah dikembangkan oleh Hubert (2004). Saya mempunyai jurnalnya, jika Sdr. Haniaty ingin tahu lebih jauh.
    Saya pernah mencoba menerapkan robust PCA pada reduksi data pengeluaran di Provinsi Jawa Tiur Tahun 2002. Hasilnya sangat mengesankan. Untuk mereduksi data dengan mempertahankan variasi data lebih dari 80 persen, PCA klasik membutuhkan minimal 11 komponen dari 21 komponen yang ada sementara RPCA cukup menggunakan 3 komponen saja.
    Terima kasih.

  86. HANIATY Says:

    setahu saya ga da tu robust PCA.thanks ya da infonya..

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

Follow

Get every new post delivered to your Inbox.

Join 65 other followers