Langsung ke konten utama

Penerapan Two Stage Sampling dengan R

Two Stage Sampling dengan R

Seiring dengan perkembangan teknik pengambilan sampel, para ahli statistika kemudian mengkombinasikan antara satu teknik sampling dengan teknik yang lainnya. Hal ini dilakukan mengingat dalam kenyataannya , karakteristik populasi sesungguhnya tidaklah ideal sehingga memerlukan lebih dari satu tahapan dalam menentukan sampel yang memenuhi aspek keterwakilan populasi.

Ada banyak kombinasi teknik sampling yang kemudian diaplikasikan. Namun pada prinsipnya kombinasi teknik sampling itu hanya sama atau berbeda cara di setiap tahapannya sedemikian rupa sehingga diperoleh sampel pada tahapan akhir. Bila tahapan yang dibutuhkan sebanyak 2 tahap, maka inilah yang kemudian diistilahkan dengan Two Stage Sampling (TSS). Kalau tahapannya berjumlah 3, maka disebut Three Stage Sampling dan seterusnya.

Adapun teknik mengambil sampel di setiap tahapan sendiri telah kita pelajari bersama di sini [1], [2], [3], [4], dan [5]. Sebagai contoh saja, pada artikel kali ini kita akan mempraktikkan Two Stage Sampling kombinasi antara Simple Random Sampling (SRS) dan SRS (SRS-SRS) tanpa pengembalian (without replacement, wor). Data yang kita gunakan merupakan data Indeks Pembangunan Manusia atau HDI Kabupaten/Kota se-Jawa Timur tahun 2022 yang dapat diunduh pada tautan berikut.

Setelah datanya telah siap, implementasi Two Stage Sampling SRS-SRS wor dengan R dapat mengikuti langkah-langkah berikut:


#Aktivasi package
library(readxl)

#Import data
data <- read_excel("ipmjatim.xlsx")

#Melihat Sekilas data
head(data)
## # A tibble: 6 x 2
##   Kako                    IPM
##   <chr>                 <dbl>
## 1 Kabupaten Pacitan      69.4
## 2 Kabupaten Ponorogo     71.9
## 3 Kabupaten Trenggalek   71  
## 4 Kabupaten Tulungagung  74.1
## 5 Kabupaten Blitar       71.9
## 6 Kabupaten Kediri       73.5
#Menentukan jumlah sampel pada tahap 1
n1 <- 30

#Stage 1: Simple Random Sampling Without Replacement
samp1 <- sample(nrow(data), n1, replace = FALSE)

# Mengambil subset data hasil sampling tahap 1
data_stage1 <- data[samp1,]

#Sampel pada tahap 1
data_stage1
## # A tibble: 30 x 2
##    Kako                    IPM
##    <chr>                 <dbl>
##  1 Kabupaten Bondowoso    67.3
##  2 Kabupaten Pamekasan    67.0
##  3 Kabupaten Banyuwangi   71.9
##  4 Kabupaten Bangkalan    65.0
##  5 Kabupaten Pacitan      69.4
##  6 Kabupaten Probolinggo  67.0
##  7 Kabupaten Bojonegoro   70.1
##  8 Kota Malang            82.7
##  9 Kabupaten Malang       71.4
## 10 Kota Probolinggo       74.6
## # ... with 20 more rows
#Menentukan jumlah sampel pada tahap 2
n2 <- 10

#Stage 2: Simple Random Sampling Without Replacement
samp2 <- sample(nrow(data_stage1), n2, replace = FALSE)

#Mengambil subset data hasil sampling tahap 2
data_final <- data_stage1[samp2,]

#Sampel terpilih two stage sampling
data_final
## # A tibble: 10 x 2
##    Kako                  IPM
##    <chr>               <dbl>
##  1 Kabupaten Malang     71.4
##  2 Kabupaten Jombang    74.0
##  3 Kabupaten Gresik     77.2
##  4 Kabupaten Lamongan   74.0
##  5 Kabupaten Pamekasan  67.0
##  6 Kabupaten Ponorogo   71.9
##  7 Kabupaten Kediri     73.5
##  8 Kabupaten Pacitan    69.4
##  9 Kabupaten Ngawi      71.8
## 10 Kota Batu            77.2
#Perbandingan rata-rata populasi dan sampel terpilih dari two stage sampling SRS-SRS wor
cat("Rata-rata IPM populasi adalah sebesar", mean(data$IPM),
    "sedangkan rata-rata IPM sampel two stage sampling sebesar", mean(data_final$IPM))
## Rata-rata IPM populasi adalah sebesar 72.96921 sedangkan rata-rata IPM sampel two stage sampling sebesar 72.727

Berdasarkan hasil di atas, terlihat bahwa rata-rata sampel 10 wilayah sampel cukup mendekati rata-rata untuk keseluruhan wilayah yang dalam konteks ini dijadikan sebagai populasi. Artinya, untuk melihat rata-rata IPM keseluruhan wilayah di Jawa Timur tahun 2022, kita cukup mengambil sampel sebanyak 10 wilayah saja sehingga lebih efisien dan efektif.

Demikian sedikit sharing kita kali ini. Jangan lupa untuk terus menyimak setiap artikel terbaru dan menarik lainnya di blog ini. Selamat memahami dan mempraktikkan!

Komentar

Postingan populer dari blog ini

Mencari P - Value dan Titik Kritis Uji F, Uji t, Uji Chi Square, dan Uji Z Normal dengan R

Mencari nilai p-value dan titik kritis Bagi teman-teman yang pernah mengenal statistika, pasti familier dengan istilah p-value dan titik kritis. P-value biasanya didefinisikan sebagai probabiltas atau peluang maksimal yang diamati dari hasil uji statistik, bahasa gampangnya adalah besarnya kesalahan penelitian berdasarkan uji statistik. Sebagai contoh sederhana, dari 100 orang dengan nama masing-masing dan diklasifikasikan ke dalam gender nama perempuan dan nama laki-laki, didapatkan nilai p-value uji statistiknya sebesar 0,05 atau 5%. Itu artinya, dari 100 orang, ada kemungkinan sebanyak 5 orang yang namanya salah klasifikasi. Dari namanya terdeteksi sebagai nama perempuan, padahal aktualnya yang bersangkutan bergender laki-laki. Sedangkan titik kritis atau titik uji adalah nilai batas pengujian hipotesis statistik, apakah masuk dalam wilayah tolak hipotesis, ataukah gagal menolaknya. Titik ini berkaitan erat dengan nilai p-value . Kalau biasanya kita mendapatkan kedua nilai ini da...

Cara Mendowload dan Install R serta RStudio di Windows (Step by Step)

Cara Download dan Install R serta R Studio di Windows Halo teman-teman, mohon maaf karena beberapa waktu ini, blog ini sempat vakum dari unggahan. Kali ini saya akan coba berbagai mengenai bagaimana cara mengunduh ( download ) dan menginstal ( install ) program R sekaligus R Studio khususnya di Windows. Unggahan kali ini sedikit terbalik karena semestinya saya unggah terlebih dahulu pertama kali di blog ini, namun bukan masalah, mengingat kemarin ada beberapa pihak yang meminta untuk menerangkap bagaimana tahapan mengunduh dan instalasi R dan R Studio, jadinya saya dahulukan pada unggahan ini sebelum pembahasan mengenai Data Mining , Data Science , atau bahasan Big Data kita terlampau jauh. Baik, kita akan mulai dengan bagaimana mengunduh R dan R Studio melalui mesin pencari Google. R dan R Studio ini memang beberapa waktu terakhir ini booming , apalagi dengan munculnya konsep mengenai Big Data , Data Modelling, Data Mining, dan Data Science serta Data Visualization . Sebenarnya, men...

Analisis Tipologi Klassen (Klassen Typology) dan Visualisasi Spasialnya dengan R

Tipologi Klassen dan visualisasinya dengan R Halo teman-teman, sebelumnya kita telah membahas tentang analisis Shift Share dan Location Quotient (LQ) dengan menggunakan R. Kali ini, kita akan membahas mengenai satu lagi alat analisis yang sebenarnya merupakan alat analisis tiga serangkai dari SS dan LQ, yaitu analisis Tipologi Klassen. Dalam penelitian ekonomi kewilayahan, ketiga analisis ini seringkali digunakan, baik dalam rangka melihat perkembangan dan transformasi struktur ekonomi suatu wilayah maupun melihat keunggulan kompetitif dan keunggulan komparatif wilayah satu dengan wilayah lainnya dengan mengacu wilayah referensi. Terlebih dulu, sebelum melakukan visualisasi spasial menggunakan fungsi plot(), ada baiknya kita bahas terlebih dahulu mengenai Tipologi Klassen itu sendiri. Tipologi Klassen merupakan teknik pengelompokan sektor, subsektor, lapangan usaha, atau komoditas tertentu di wilayah analisis berdasarkan pertumbuhan nilai tambah wilayah analisis terhadap nasional atau...