Bismillah, dengan mengagungkan asma Alloh, situs statistikaterapan.com merupakan upgrade blog statistikaterapan.wordpress.com. Dengan hadirnya, statistikaterapan.com diharapkan menjadi pemicu bagi penulis untuk lebih banyak lagi beramal jariyah berupa ilmu yang bermanfaat khususnya terkait ilmu statistika terapan.

Salam,

Suryana.

Seringkali kita disuguhkan sajian data dalam bentuk relatif dari hasil suatu survei. Sebagai contoh, perhatikan Gambar berikut:

Contoh Data

Sekilas tidak ada masalah dari sajian data di atas. Tetapi, sebagai pengguna data, kita membutuhkan informasi lebih detil dari data di atas. Pertama, pada tingkatan mana data ini disajikan? apakah sajian data untuk tingkat nasional, provinsi, kabuaten/kota dst? Kedua, berapa unit observasi yang berhasil dikumpulkan?

Data survei memiliki keterbatasan dalam penyajian hasil-hasilnya. Sebagai contoh, Survei Sosial Ekonomi Nasional (Susenas) hingga saat ini hanya bisa disajikan sampai tingkat kabupaten/kota.  Itupun tidak bisa disajikan menurut perkotaan dan perdesaan di tingkat kabupaten/kota. Contoh lain, Survei Demografi dan Kesehatan Indonesia (SDKI) hanya bisa disajikan sampai tingkat provinsi saja. Memaksakan penyajian data dari sisi tingkatan wilayah penyajian data akan menghantarkan kita pada kesimpulan yang keliru dari data yang disajikan.

Aspek kedua yang penting untuk diperhatikan adalah jumlah unit observasi yang berhasil dikumpulkan. Kendati dari aspek kewilayahan memenuhi syarat untuk disajikan tetapi jika jumlah minimum observasi yang terkumpul tidak terpenuhi akan memberikan kesimpulan yang tidak tepat.  Data pada Grafik di atas adalah bersumber dari Susenas di salah satu kabupaten/kota dengan jumlah obesrvasi (balita umur 0 – 4 tahun) yang berhasil dikumpulkan kurang dari 25 sampel.

Permasalahannya adalah, berapa jumlah minimum observasi yang harus terpenuhi untuk penyajian indikator? Untuk menjawab pertanyaan ini, penulis merefer pada prosedur penyajian data MICS (Multiple Indicators Cluster Survei) di mana ketentuan penyajian indikator adalah sebagai berikut: #, (#), *. Simbol # menyatakan indikator disajikan karena jumlah observasi terkumpul lebih dari 50 sampel. Simbol (#) menyatakan bahwa indikator dihitung dari jumlah observasi kurang dari 50 tetapi lebih dari 25. Nilai Indikator tidak akan disajikan atau diberi simbol * jika jumlah observasi kurang dari 25. Pada contoh data pada Grafik di atas, seharusnya tidak bisa disajikan karena jumlah observasi yang kurang dari 25.

Satu hal lagi, pada saat jumlah observasi lebih dari 50 sampel belum bisa langsung kita yakini keabsahan datanya. Masih ada ketentuan lain lagi yang patut dipertimbangkan yaitu relative standard error atau RSE. RSE merupakan perbandingan Standard Error dari suatu estimasi statistik dengan nilai statistiknya. Jika RSE bernilai antara 25 sd 50, pengguna data wajib berhati-hati menggunakan indikator yang disajikan. Jangan gunakan statistik jika RSE melebihi 50. Percaya dan yakinilah data Anda saat RSE kurang dari 25.

Dengan demikian, data yang bersumber dari suatu survei layak dipercaya jika:

1. Memenuhi syarat penyajian kewilayahan (nasional, provinsi, atau kabupaten dll);

2. Memenuhi jumlah minimal observasi yang terkumpul yaitu minimal 50

3. RSE dari data tersebut kurang dari 25.

 

 

Definisi SMAM adalah rata-rata lama masa lajang (single) yang dinyatakan dalam tahun dari mereka yang menikah sebelum usia 50 tahun. Silakan merujuk pada link berikut untuk detil pengertian SMAM (SINGULATE MEAN AGE AT MARRIAGE).

Biasanya, menghitung SMAM dilakukan dengan bantuan worksheet seperti link berikut (Worksheet SMAM). Tentunya, langkah-langkah pada worksheet tersebut sesungguhnya bisa diringkas dengan menggunakan sintaks SPSS. Silakan Unduh link berikut (11. SMAM Provinsi Total atau 12. SMAM Provinsi By Kabupaten dan Kota Desa ).

Untuk mengoperasikannya jalankan di SPSS, ubahlah folder di mana data individu yang memuat informasi umur dan status perkawianan Anda tempatkan. Sesuaikan nama variabel yang Anda gunakan dengan nama variabel yang ada pada sintaks SMAM tersebut. Semoga bisa membantu.

//

Bagi pemerhati data, penting untuk mengetahui kualitas hasil suatu survei. Kualitas hasil suatu survei dipengaruhi oleh dua jenis kesalahan yaitu: pertama, kesalahan non sampling atau non sampling error  dan kesalahan kedua karena terkait sampling (sampling error). Kesalahan non sampling ada karena kesalahan-kesalahan yang muncul pada pelaksanaan survei. Misalnya, kesalahan menyampaikan konsep dan definisi dari instruktur pelatihan ke petugas pencacah maupun pengawas, kesalahan pada saat mengajukan pertanyaan dari pewawancara kepada responden, salah pengertian antara responden dan pewawancara/pencacah, juga kesalahan waktu merekam data pada saat pengolahan.

Posting kali ini akan membahas lebih banyak kesalahan karena sampling. Sampling Error dapat dianalisis secara statistik. Suatu nilai estimasi  terhadap parameter suatu populasi atau kita sebut dengan statistik digenerate atau dibangun dari gugusan sampel yang dipilih menggunakan desain sampling tertentu. Setiap gugus sample yang terpilih menghasilkan angka yang berbeda-beda dengan gugus sample lainnya. SE adalah suatu ukuran keragaman dari semua gugus sampel yang mungkin terpilih. Meskipun nilai yang sebenarnya tidak diketahui, tetapi dapat diperkirakan dari hasil survei. Satu ukuran yang biasa digunakan untuk mengukur seberapa jauh nilai statistik berbeda dengan nilai parameternya karena hanya menggunakan satu gugus sample disebut standard error (SE). Apabila SE dirasiokan terhadap nilai statistiknya dan dinyatakan dalam persen, statistisi menyebut perhitungan tersebut dengan istilah Relative Standard Error (RSE).

Sejauh ini, baru dua ukuran statistik yang telah Penulis perkenalkan untuk mengukur kualitas hasil suatu survei. Ada satu ukuran lagi yang biasa digunakan untuk mengukur kualitas hasil survei yaitu menghitung efek rancangan (Design Effect atau disingkat DEFF). DEFF dihitung dengan membandingkan SE suatu rancangan tertentu dengan SE jika menggunakan simple random sampling. Jika DEFF bernilai satu bermakna bahwa disain survei yang digunakan sama efisiennya dengan menggunakan disain simple random sampling. Sebaliknya, jika DEFF lebih besar dari satu menunjukkan bahwa desain survei yang digunakan kurang efisian karena menghasilkan nilai SE yang lebih besar dibandingkan dengan jika menggunakan disain simple random sampling.

Seingat penulis, BPS telah menerbitkan statistik SE, RSE dan DEFF ini pada Survei Demografi dan Kesehatan Indonesia (SDKI). Ukuran ini juga mulai diperkenalkan di Survei Sosial Ekonomi Nasional (Susenas) sejak tahun 2008 tetapi hanya sebatas SE dan RSE. Demikian juga Survei Angkatan Kerja Nasional, telah mulai menghitung SE dan RSE ini sejak tahun 2012. Ukuran statistik tersebut menjadi prasyarat bagi keterbukaan informasi hasil survei yang dilakukan BPS kepada pengguna data. Pertanyaannya adalah bagaimana metode penghitungan SE, RSE dan DEFF yang digunakan itu? Apa kriteria untuk menyatakan seberapa hasil suatu survei itu?

Di sini, Penulis hanya menguraikan metode penghitungan SE dan RSE untuk Susenas karena keseharian penulis sebagai penanggung jawab teknis seksi kesejahteraan rakyat yang menangani Susenas di Papua Barat. Disain sampling Susenas dirancang dua tahap, yaitu pemilihan blok sensus secara Probability Proportional to Size atau PPS dengan size jumlah rumah tangga di setiap blok sensus hasil sensus penduduk tahun 2010 atau SP2010. Pada tahap selanjutnya, sebanyak 10 rumah tangga dipilih secara acak dengan disain systematic sampling. Oleh karena disain Susenas tidak sesederhana disain simple random sampling, maka proses penghitungan SE dam RSE menggunakan alat bantu yaitu aplikasi program STATA. Dalam hal ini, penulis menggunakan program STATA 8. Aplikasi STATA bisa digunakan untuk menghitung kesalahan sampling sesuai dengan metodologi yang digunakan dalam hal ini (Susenas) menggunakan sampling dua tahap. STATA menggunakan metode Taylor Linearization untuk mengestimasi baik nilai total maupun rata-ratanya.

Metode Linierizasi Taylor memperlakukan persentase atau rata-rata sebagai suatu estimasi rasio, r = y/x, dengan y sebagai total nilai sampel untuk variabel y, dan x adalah jumlah kasus dalam grup atau subgrup yang diperhitungkan. Varians dari r dihitung menggunakan rumus:

TL1

dengan

TL2

dimana

h      adalah stratum yang mempunyai nilai antara 1 dan H,

mh    adalah jumlah blok sensus terpilih dalam stratum h,

yhi    adalah jumlah tertimbang nilai dari variabel y dalam blok sensus i, stratum h,

xhi    adalah jumlah kasus  dalam blok sensus i dan stratum h, dan

f       adalah fraksi sampling, yang karena nilainya kecil, tidak diperhitungkan.

Tidak semua SE dan RSE variabel hasil suatu survei dihitung tetapi hanya SE dan RSE dari beberapa variabel penting saja yang dihitung. Di sini, penulis mencoba share sintaks STATA yang digunakan untuk menghitung SE dan DEFF beberapa variabel hasil Susenas misalnya RSE-APK dan RSE-MYS. Silakan unduh file-file tersebut dan jalankan di STATA.

Cara menjalankannya cukup sederhana. Bukalah aplikasi stata. Kopikan sintaks di dalam file tersebut ke dalam window do-file editor di stata lalu simpan dengan ekstensi.do. Hal lain yang perlu disiapkan adalah format data susenas dalam bentuk stata. Pastikan alamat data susenas yang disimpan sesuai dengan alamat data di sintaks. Untuk menjalankan sintaks tersebut kita tinggal klik File do…. dan pilih sintaks yang akan dijalankan.

Kualitas hasil estimasi suatu survei bisa diamati dari RSE yang dihasilkan. Menurut Soedarti dkk (2007), keputusan mengenai keakuratan suatu estimasi bisa diamati dari tabel berikut.

Kondisi

Perlakuan

RSE ≤ 25%

Akurat (bisa digunakan)

25% < RSE  ≤ 50%

Perlu hati-hati jika digunakan

RSE > 50%

Dianggap tidak akurat (harus digabungkan dengan estimasi lain untuk memberikan estimasi dengan RSE ≤ 25%.

Demikian, posting ini dipersembahkan. Semoga bermanfaat bagi pengguna data khususnya pengguna data hasil Susenas agar bisa mengetahui mana data Susenas yang akurat dan mana data Susenas yang perlu kehati-hatian penggunaanya karena nilai RSE yang besar.

Masih terkait dengan penghitungan Gini Ratio, pada posting kali ini, Penulis memperkenalkan penghitungan Gini Ratio dengan memanfaatkan sintaks SPSS. Menghitung Gini Ratio dengan Stata memang mudah, tetapi tidak semua pembaca mempunyai softwarenya. Karena itu, Penulis coba menghadirkan cara lain penghitungan Gini Ratio dengan menggunakan SPSS.

Ada dua cara menghitung Gini Ratio. Cara pertama dengan melakukan pengelompokkan data berdasarkan pengeluaran tertentu. Misalnya, pengeluaran penduduk atau rumah tangga dibagi menjadi 10 kelompok. Formula Gini Ratio untuk data berkelompok sebagai berikut:

Di mana

Pi = Proporsi Penduduk pada Kelompok Pengeluaran ke-i ;

Fi dan Fi-1 = Kumulatif Proporsi Pengeluaran pada kelompok pengeluaran ke-i dan           ke – (i – 1).

Penghitungan Gini Ratio berdasarkan kelompok pengeluaran tertentu secara manual dengan memanfaatkan worksheet excell sudah Penulis posting lebih dahulu.

Cara kedua penghitungan Gini Ratio tanpa membuat pengelompokkan pengeluaran. Karena itu data pengeluaran harus disusun dari pengeluaran terkecil sampai pengeluran terbesar (Ascending). Formula Gini Ratio untuk data yang tidak dikelompokkan adalah

di mana Xi dan Xi-1 = Kumulatif Proporsi Penduduk atau Rumah Tangga pada record ke-i dan ke – (i – 1).

Fi dan Fi-1 = Kumulatif Proporsi Pengeluaran pada record ke-i dan ke – (i – 1).

Posting kali ini khusus membahas menghitung Gini Ratio dengan formula yang terakhir. Silakan unduh filenya pada link Program Menghitung Gini Ratio berikut ini. Bagaimana cara menggunakannya?

Buka Data Pengeluaran dalam format SPSS. Di sini, penulis menggunakan data Susenas Tahun 2011 dari Modul Konsumsi (Blok 43.sav). Dalam data tersebut, pengeluaran rumah tangga tersimpan dalam variabel expend dan pembobot rumah tangga WERT. Setelah data tersebut terbuka, buka sintaks penghitungan Gini Ratio, dan Run. Status Bar pada Pojok Kiri aplikasi SPSS akan tertulis “Transformations Pending.” Untuk menyelesaikannya, Anda hanya diminta melakukan klik Menu Transform dan pilih Runs Pending Transform atau Tekan Ctrl + G. Selamat Mencoba.

Melanjutkan posting sebelumnya dengan tema menghitung gini ratio menggunakan stata, kali ini Penulis akan share cara-cara mengatasi masalah apabila command ineqdeco tidak dikenal stata. Ada dua langkah untuk mengatasinya. Langkah pertama dengan mengetik perintah
ssc install ineqdeco.
Dengan perintah ini Anda meminta server Stata untuk menginstallkan ineqdeco ke software stata yang anda miliki. Jika langkah ini mulus, maka eksekusi perintah ineqdeco akan dikenali stata.
Jika cara pertama, tidak juga berhasil. Lakukan langkah berikut. Buka browser anda dan ketikkan

http://fmwww.bc.edu/repec/bocode/i/ineqdeco5.ado

Anda akan dibukakan page sintaks ineqdeco5. Kopi semua sintaks tersebut dan paste pada jendela ‘do-file editor’. Selanjutnya simpan di
C:\ado\personal
dengan ekstensi .ado.
Setelah langkah ini, Penulis jamin perintah ineqdeco atau ineqdeco5 Anda dikenali oleh stata dan penghitungan gini ratio bisa diselesaikan. Selamat mencoba.

Selamat bertemu kembali setelah sekian lama tidak mengupdate blog statistikaterapan. Pada posting kali ini, tema tulisan masih terkait menghitung ketimpangan pendapatan penduduk yang didekati dengan variabel pengeluaran. Pada posting sebelumnya, penulis memperkenalkan koefisien gini atau gini ratio sebagai alat ukut ketimpangan pendapatan yang dihitung secara manual. Sebagai alat bantu disediakan pula worksheet excell untuk menghitungnya.

Pada posting kali ini, berbekal dari sharing ilmu dari sahabat saya, Mas Sapta dan mas Budi Santoso (saat ini bertugas di BPS RI Direktorat Statistik Kesejahteraan rakyat), menghitung gini ratio lebih mudah dan cepat dengan menggunakan STATA. STATA menyediakan perintah ineqdeco untuk menghitung ketimpangan. Jika pembaca ingin mengetahui sintaxnya secara lengkap silakan download file ineqdeco di link berikut: http://fmwww.bc.edu/repec/bocode/i/ineqdec0.ado untuk penggunan STATA 8.2 atau lebih atau http://fmwww.bc.edu/repec/bocode/i/ineqdeco5.ado untuk pengguna STATA 5 sampai dengan 8.1.

Manfaat perintah ineqdeco, penulis kutipkan dari penemunya Mr. Stephen P. Jenkins (1999) sebagai berikut, “ineqdeco estimates a range of inequality and related indices commonly used by economists, plus optional decompositions of a subset of these indices by population subgroup. Indices estimated are: members of the single parameter Generalized Entropy class GE(a) for a = -1, 0, 1, 2; the Atkinson class A(e) for e = 0.5, 1, 2; the Gini coefficient, and the percentile ratios p90/p10 and p75/p25.” Jadi, dengan ineqdeco bukan saja gini ratio yang dihasilkan tetapi indeks-indeks ketimpangan lain juga bisa dihitungkan.

Bagaimana menggunakannya? Saya menggunakan data pengeluaran hasil Survei Sosial Ekonomi Nasional Tahun 2011 Modul Konsumsi. File yang digunakan adalah BLOK43_91.sav (format SPSS). Didalamnya terdapat data pengeluaran perkapita penduduk per rumah tangga yang disimpan dalam variabel “kapita” dan pembobot individu dalam variabel “weind.” Untuk bisa menghitung gini ratio dengan menggunakan stata, transfer file dari format SPSS  menjadi format data stata dengan ekstensi .dta. Anda bisa menggunakan StatTransfer untuk melakukannya sehingga file yang terbentuk menjadi BLOK43_91.dta.

Mari kita mulai menghitung gini ratio dengan STATA. Pertama-tama, bukalah software stata Anda. Perhatikan versi STATA yang digunakan. Selanjutnya, buka data yang sudah berbentuk format dengan ekstensi .dta. Untuk pengguna STATA 5 sd STATA 8.1 ketikkan perintah berikut di jendela STATA COMMAND:

ineqdeco5 kapita [weight=weind]

untuk menghitung gini ratio pada level provinsi. Jika Anda ingin menghitung Gini Ratio sampai tingkat kabupaten, gunakan perintah:

ineqdeco5 kapita [weight=weind], bygroup(b1r2)

di mana b1r2 adalah variabel kabupaten/kota.

Untuk pengguna STATA 8.2 ke atas, ganti perintah ineqdeco5 di atas dengan ineqdeco.

Dengan perintah-perintah di atas, maka ukuran ketimpangan tidak saja gini ratio tetapi ukuran ketimpangan yang lain dihasilkan dengan mudah. Selamat mencoba pembaca, semoga posting kali membantu menyelesaikan tugas-tugas Anda. Wassalam.

 

Jumat, 3 Maret 2012 lalu, penulis kedatangan konsultan UNICEF bernama Ikhtier. Selama enam hari, penulis memperoleh pengetahuan baru bagaimana proses pengolahan data dengan menggunakan CSPRo dan dilanjutkan dengan tabulasi data menggunakan SPSS. Salah satu “jurus” baru SPSS yang diajarkan adalah penggunaan syntax.

Pada posting kali ini, penulis akan membagi pengetahuan yang diperoleh dari statistics capasity building (SCB) selama enam hari itu. Pertama, bagaimana menjalankan beberapa syntax SPSS sekaligus tanpa membukanya terlebih dahulu. Kedua, bagaimana menyimpan output SPSS baik dalam format SPSS maupun dalam format excell.

Sebelum SCB dengan Mr. Ikhtier, penulis terbiasa menjalankan syntax satu per satu hingga seluruh syntax selesai dijalankan. Sebagai contoh, dalam penghitungan kemiskinan, penulis membutuhkan 8 syntax terpisah. Kedelapan syntax penghitungan kemiskinan itu terdiri dari: 1) Syntax pemilihan populasi referensi, 2) syntax pemilihan basket makanan, 3) pemilihan syntax pemilihan basket non makanan, 4) syntax penggabungan basket makanan ke populasi referensi, 5) syntax penggabungan basket non makanan ke populasi referensi, 6) syntax penghitungan garis kemiskinan makanan, 7) syntax penghitungan kemiskinan non makanan, dan terakhir syntax penghitungan garis kemiskinan. Bagaimana menjalankan kedelapan syntax tersebut sekaligus?

Ternyata, untuk menjalankan beberapa syntax SPSS, cukup menggunakan perintah “INCLUDE” dan diikuti dengan lokasi syntax yang akan dieksekusi. Untuk contoh di atas, penulis membuat file syntax baru yang berisi:

include “D:\Kemiskinan Maret 2011\1. Syntax Populasi Referensi 91.sps”.

include “D:\Kemiskinan Maret 2011\2. Syntax Basket Makanan 91.sps”.

include “D:\Kemiskinan Maret 2011\3. Syntax Basket Bukan Makanan 91.sps”.

include “D:\Kemiskinan Maret 2011\4. Syntax Gabung Basket Makanan 91 ke Pop Ref.sps”.

include “D:\Kemiskinan Maret 2011\5. Syntax Gabung Basket Bukan Makanan 91 ke Pop Ref.sps”.

include “D:\Kemiskinan Maret 2011\6. GKM 91.sps”.

include “D:\Kemiskinan Maret 2011\7. GKNM 91.sps”.

include “D:\Kemiskinan Maret 2011\8. GK 91.sps”.

Dengan perintah tersebut, penulis tidak perlu lagi membuka satu demi satu syntax penghitungan penduduk miskin.

Untuk menyimpan output SPSS, bisa menggunakan perintah “OUTPUT SAVE” untuk menyimpan file dalam format SPSS dan perintah “OUTPUT EXPORT” untuk menyimpan file output dalam format selain SPSS, misalnya excell. Contoh penggunaan kedua perintah tersebut sebagai berikut:

* Create the SPSS output.

output save outfile = “D:\Kemiskinan Maret 2011\Tabel Kemiskinan Papua Barat.spv”.

* Export Output into an excel file.

output export

/contents export = visible layers = printsetting modelviews = printsetting

/xls documentfile = “D:\Kemiskinan Maret 2011\Tabel Kemiskinan Papua Barat.xls”

operation = createfile

location = lastcolumn notescaptions = yes.

Sampai di sini dulu, sharing syntax SPSS yang baru saja penulis ketahui. Selamat mencoba dan Semoga bermanfaat.

Follow

Get every new post delivered to your Inbox.

Join 64 other followers