Langsung ke konten utama

Penerapan Cluster Sampling dengan R

Cluster Sampling dengan R

Dalam suatu riset, adakalanya kita tidak mengetahui mengenai kondisi dari populasi yang menjadi target riset. Sebenarnya, bisa saja kita mengambil sejumlah sampel begitu saja tanpa harus menggunakan teknik sampling yang rumit, namun sekali lagi, kendati dinilai sebagai pengambilan sampel yang acak (random), tapi sebenarnya belum sepenuhnya sesuai kaidah random dalam kaidah statistik. Sebab, yang dikatakan random adalah keacakan yang memastikan setiap elemen dalam populasi mempunyai peluang yang sama untuk terpilih.

Sudah tidak tahu kondisi populasi, tiba-tiba kita harus mengambil sampel. Tentu hal ini sangat berisiko terhadap proses bisnis statistik berikutnya karena bisa jadi berujung pada kesimpulan atau inferensi yang salah. Bila kesimpulan yang ditentukan salah, efek dominonya juga menyebabkan kebijakan juga kemungkinan besar salah.

Untuk itu, sebelum memilih sampel, ada baiknya kita memang menentukan terlebih dahulu teknik sampling yang tepat. Tidak melulu harus rumit, namun ketepatan teknik sampling sangat menentukan keakuratan prediksi atau estimasi.

Kita sebelumnya telah mengenal tentang apa itu Simple Random Sampling (SRS), Systematic Random Sampling, Stratified Random Sampling. Dalam artike kali ini, kita akan melanjutkan pembahasan satu lagi teknik sampling yang banyak digunakan dalam riset atau penelitian, yaitu Cluster Sampling atau teknik sampling klaster.

Bila pada teknik sampling sebelumnya kita memerlukan adanya kerangka sampel (sampling frame) sebelum melakukan proses pengambilan sampel atau responden, dalam Cluster Sampling justru sebaliknya. Cluster Sampling merupakan teknik pengambilan sampel ketika kerangka sampel tidak tersedia atau tidak diketahui. Misalnya saja, sebuah riset yang dilakukan terhadap populasi target satu Satuan Lingkungan Setempat (SLS) yang baru terbentuk akibat adanya program reklamasi wilayah.

Dalam konsep Cluster Sampling, kumpulan elemen di dalam populasi target dipandang sebagai unit pengambilan sampel sedemikian rupa sehingga varians (ragam) antar klaster diharapkan sehomogen mungkin dan di dalam klaster seheterogen mungkin. Adapun manfaat dari penerapan Cluster Sampling adalah untuk mengefisiensikan biaya dan mencapai akurasi yang tinggi.

Lantas, bagaimana penerapan Cluster Sampling dengan R?

Berikut sedikit contoh kasus penerapan Cluster Sampling dengan paket program R. Kasus yang kita angkat kali ini adalah sebuah riset untuk memperoleh rata-rata nilai tes Matematika SPMB Politeknik Statistika STIS (Polstat STIS) tahun 2023. Adapun jumlah peserta yang ikut sebanyak 144 orang dan terbagi dalam 36 ruang kelas. Dari 36 kelas, dipilih sebanyak 5 kelas dan masing-masing kelas diambil masing-masing 4 peserta untuk dilihat nilai hasil tes Matematikanya. Diketahui bahwa rata-rata keseluruhan peserta tes Matematika adalah sebesar 75 dengan standard deviasi (sd) sebesar 10. Dari kasus ini, penerapan Cluster Sampling menggunakan R dapat mengikuti langkah-langkah berikut:


#Melakukan pengacakan sebanyak 1 kali
set.seed(1)

#Membuat dataframe
df <- data.frame(id_tes = rep(1:36, each=4),
                 nilai = rnorm(144, mean=75, sd=10))
#Melihat sekilas data
head(df)
##   id_tes    nilai
## 1      1 68.73546
## 2      1 76.83643
## 3      1 66.64371
## 4      1 90.95281
## 5      2 78.29508
## 6      2 66.79532
#Memilih 5 ruangan dari 36 ruangan dan memilih masing-masing 4 peserta tes pada tiap ruangan
klaster <- sample(unique(df$id_tes), size=4, replace=F)

#Mendefinisikan sampel terpilih untuk masing-masing ruangan tes
sampel <- df[df$id_tes %in% klaster, ]

#Melihat peserta terpilih di 5 ruangan
table(sampel$id_tes)
## 
##  7  8  9 26 
##  4  4  4  4

Dari hasil di atas, terlihat bahwa klaster terpilih adalah klaster 7, 8, 9, dan 26 dan masing-masing terdiri atas 4 peserta sebagai responden untuk kemudian diperoleh rata-ratanya serta standar erornya.

Demikian sedikit sharing kita kali ini. Simak dan ikuti terus setiap artikel terbaru dan unik dalam blog ini. Selamat memahami dan mempraktikkan!

Komentar

Postingan populer dari blog ini

Mencari P - Value dan Titik Kritis Uji F, Uji t, Uji Chi Square, dan Uji Z Normal dengan R

Mencari nilai p-value dan titik kritis Bagi teman-teman yang pernah mengenal statistika, pasti familier dengan istilah p-value dan titik kritis. P-value biasanya didefinisikan sebagai probabiltas atau peluang maksimal yang diamati dari hasil uji statistik, bahasa gampangnya adalah besarnya kesalahan penelitian berdasarkan uji statistik. Sebagai contoh sederhana, dari 100 orang dengan nama masing-masing dan diklasifikasikan ke dalam gender nama perempuan dan nama laki-laki, didapatkan nilai p-value uji statistiknya sebesar 0,05 atau 5%. Itu artinya, dari 100 orang, ada kemungkinan sebanyak 5 orang yang namanya salah klasifikasi. Dari namanya terdeteksi sebagai nama perempuan, padahal aktualnya yang bersangkutan bergender laki-laki. Sedangkan titik kritis atau titik uji adalah nilai batas pengujian hipotesis statistik, apakah masuk dalam wilayah tolak hipotesis, ataukah gagal menolaknya. Titik ini berkaitan erat dengan nilai p-value . Kalau biasanya kita mendapatkan kedua nilai ini da...

Cara Mendowload dan Install R serta RStudio di Windows (Step by Step)

Cara Download dan Install R serta R Studio di Windows Halo teman-teman, mohon maaf karena beberapa waktu ini, blog ini sempat vakum dari unggahan. Kali ini saya akan coba berbagai mengenai bagaimana cara mengunduh ( download ) dan menginstal ( install ) program R sekaligus R Studio khususnya di Windows. Unggahan kali ini sedikit terbalik karena semestinya saya unggah terlebih dahulu pertama kali di blog ini, namun bukan masalah, mengingat kemarin ada beberapa pihak yang meminta untuk menerangkap bagaimana tahapan mengunduh dan instalasi R dan R Studio, jadinya saya dahulukan pada unggahan ini sebelum pembahasan mengenai Data Mining , Data Science , atau bahasan Big Data kita terlampau jauh. Baik, kita akan mulai dengan bagaimana mengunduh R dan R Studio melalui mesin pencari Google. R dan R Studio ini memang beberapa waktu terakhir ini booming , apalagi dengan munculnya konsep mengenai Big Data , Data Modelling, Data Mining, dan Data Science serta Data Visualization . Sebenarnya, men...

Analisis Tipologi Klassen (Klassen Typology) dan Visualisasi Spasialnya dengan R

Tipologi Klassen dan visualisasinya dengan R Halo teman-teman, sebelumnya kita telah membahas tentang analisis Shift Share dan Location Quotient (LQ) dengan menggunakan R. Kali ini, kita akan membahas mengenai satu lagi alat analisis yang sebenarnya merupakan alat analisis tiga serangkai dari SS dan LQ, yaitu analisis Tipologi Klassen. Dalam penelitian ekonomi kewilayahan, ketiga analisis ini seringkali digunakan, baik dalam rangka melihat perkembangan dan transformasi struktur ekonomi suatu wilayah maupun melihat keunggulan kompetitif dan keunggulan komparatif wilayah satu dengan wilayah lainnya dengan mengacu wilayah referensi. Terlebih dulu, sebelum melakukan visualisasi spasial menggunakan fungsi plot(), ada baiknya kita bahas terlebih dahulu mengenai Tipologi Klassen itu sendiri. Tipologi Klassen merupakan teknik pengelompokan sektor, subsektor, lapangan usaha, atau komoditas tertentu di wilayah analisis berdasarkan pertumbuhan nilai tambah wilayah analisis terhadap nasional atau...