Robust Principal Component Analysis

Robust Principal Component Analysis

Principal Component Analysis (PCA) merupakan salah satu analisis multivariat yang sangat dikenal. PCA mampu mereduksi dimensi data yang besar dan saling berkorelasi menjadi dimensi yang lebih kecil yang tidak saling berkorelasi. Meskipun dimensi data diperkecil, kita tidak kehilangan banyak informasi. Variasi data tetap dipertahankan minimal 80 persen.

Analisis komponen utama (principal component analysis=PCA) merupakan teknik statistik yang telah banyak digunakan. Pembahasan materi ini dapat ditemukan pada buku-buku analisis multivariat baik teori maupun aplikasi. Pemanfaatan PCA utamanya dalam menyusutkan dimensi data yang saling berkorelasi satu sama lain.

Perkembangan PCA dimulai sejak diperkenalkan pertama kali oleh Pearson pada tahun 1901. Sejalan dengan perkembangan teknologi komputer dan kemajuan di bidang matematika, PCA hingga kini masih terus mengalami perkembangan. Perkembangan selanjutnya, diperkenalkan generalisasi dari PCA oleh Loève pada tahun 1963.
Perkembangan PCA selanjutnya dipengaruhi adanya kebutuhan model PCA yang robust
terhadap data pencilan (outlier). PCA klasik (CPCA) sangat dipengaruhi oleh kehadiran pencilan karena CPCA didasarkan pada matrik kovarian yang juga sangat sensitif terhadap keberadaan data pencilan. Untuk mengatasi masalah ini, matrik kovarian diestimasi estimasi kovarian yang robust dengan M-estimator (Devlin, dkk, 1975), Minimum Covariance Determinant (Rousseeuw, 1984), atau S-estimator (Croux dan Haesbroek, 1999). Ketiga metode ini baik jika digunakan untuk kasus
jumlah variabel p > jumlah observasi n. Untuk kasus ini, Li dan Chen (1985) memperkenalkan robust PCA dengan Projection Pursuit (PP).
Analisis komponen utama (principal component analysis=PCA) merupakan teknik statistik
yang telah banyak digunakan. Pembahasan materi ini dapat ditemukan pada buku-buku analisis
multivariat baik teori maupun aplikasi. Pemanfaatan PCA utamanya dalam menyusutkan dimensi
data yang saling berkorelasi satu sama lain.
Perkembangan PCA dimulai sejak diperkenalkan pertama kali oleh Pearson pada tahun 1901.
Sejalan dengan perkembangan teknologi komputer dan kemajuan di bidang matematika, PCA
hingga kini masih terus mengalami perkembangan. Perkembangan selanjutnya, diperkenalkan
generalisasi dari PCA oleh Loève pada tahun 1963.
Perkembangan PCA selanjutnya dipengaruhi adanya kebutuhan model PCA yang robust
terhadap data pencilan (outlier). PCA klasik (CPCA) sangat dipengaruhi oleh kehadiran pencilan
karena CPCA didasarkan pada matrik kovarian yang juga sangat sensitif terhadap keberadaan data
pencilan. Untuk mengatasi masalah ini, matrik kovarian diestimasi estimasi kovarian yang robust
dengan M-estimator (Devlin, dkk, 1975), Minimum Covariance Determinant (Rousseeuw, 1984),
atau S-estimator (Croux dan Haesbroek, 1999). Ketiga metode ini baik jika digunakan untuk kasus
jumlah variabel p > jumlah observasi n. Untuk kasus ini, Li dan Chen (1985) memperkenalkan
robust PCA dengan Projection Pursuit (PP).

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s