Langsung ke konten utama

Postingan

Cara Penerapan dan Manfaat dari Fungsi Sprintf() di R

fungsi sprintf di R Halo teman-teman. Kali ini saya akan berbagi sedikit mengenai sebuah fungsi di R yang ke depan akan bermanfaat. Pada bahasan kali ini, kita akan mengulas tentang bagaimana menggabungkan numerik dan tipe data string atau karakter di R. Salah satu fungsi di R yang bisa digunakan dalam menggabungkan data bertipe numerik dan string adalah fungsi sprintf(). Fungsi ini bisa kita manfaatkan bila kita ingin mencetak sebuah data string misalkan kalimat yang secara otomatis tersisipi oleh data bertipe numerik. Misalkan dari hasil sebuah hitungan, kita dapatkan bahwa kecepatan laju sebauh mobil adalah 40 km per jam. Kemudian kita gabungkan dengan kalimat: mobil itu cukup lambat dengan melaju 40 km per jam. Dalam kasus seperti inilah di praktik berikut ini kita akan terapkan dengan menggunakan fungsi sprintf() yang ada di dalam R. Untuk lebih tergambar apa yang dimaksud penggabungan itu dan bagaimana cara penggunaan fungsi sprintf(), mari kita ikuti bersama beberapa code di be...

Pemodelan Regresi Robust (Robust Regression) dengan R

Regresi Robust Setelah sebelumnya kita mengulas mengenai regresi linier, logistik, probit, dan tobit, kali ini kita akan beranjak membahas mengenai pemodelan menggunakan regresi robust ( Robust regression model ). Bagi yang pernah menggunakan model ini dalam penelitiannya, saya rasa telah paham sampai ke akar-akarnya, namun dalam kesempatan kali ini kita akan mencoba belajar bersama bagaimana definisi dan bagaimana langkah-langkah melakukan pemodelan regresi robust menggunakan R. Sebelum pemodelan, ada baiknya kita ke pengertian atau teori terlebih dahulu. Jadi, regresi robust ini bermula dari pro dan kontra tentang pencilan ( outlier ) yang berada di dalam model regresi, apakah harus dibuang atau justru mengikutkannya di dalam model. Dalam bahasan-bahasan sebelumnya, telah kita dapatkan simpulan bahwa membuang atau menghapus pencilan data perlu mempertimbangkan beberapa aspek. Salah satunya adalah ketika kita membuang pencilan begitu saja, terdapat risiko informasi yang akan kita pero...

Pemodelan Regresi Tobit (Tobit Regression) dengan R

Regresi Tobit Halo teman-teman, mari kita belajar dan berbagi lagi. Setelah kita sebelumnya membahas mengenai regresi logistik atau logit serta regresi probit atau normit, kali ini kita akan beranjak ke model pengembangan dari logistik berikutnya, yaitu regresi Tobit atau regresi Tobin-Probit. Seringkali, kita mungkin masih ada yang kebingungan membedakan antara regresi logistik, probit, dan tobit ini. Penyebabnya karena masih terbatasnya referensi atau begitu banyaknya referensi sehingga membuat kesimpulan kita belum tepat untuk mempertajam perbedaan di antara ketiga model tersebut. Saya pun awalnya juga bingung mengenai ketiga bentuk regresi ini, namun dengan menelaah dari beragam sumber, saya mendapat beberapa kesimpulan yang semoga saja dapat memperjelas perbedaan ketiganya kepada teman-teman pembaca blog ini. Sebagai disclaimer , apa yang saya simpulkan ini dapat mengandung kesalahan, dan untuk itu kalau ada teman-teman yang mau memperbaiki atau menambahkan disilakan komentar saja...

Pemodelan Regresi Probit (Probit Regression) dengan R

Regresi Probit dengan R Halo teman-teman, setelah kita sebelumnya belajar dan berbagi bagaimana cara pemodelan regresi logistik biner atau yang biasa disebut sebagai logit, kali ini kita akan melangkah satu senti mengulas sekaligus mempraktikkan bagaimana pemodelan regresi Probit dengan R. Regresi probit ini harus kita ulas supaya kita semua dapat mengetahui dengan jelas dimana perbedaan antaran logistik biner dan probit. Saya pun awalnya juga bingung mengenai perbedaan kedua jenis model ini. Sebab, selain referensi yang terbatas, banyak yang mengulas perbedaannya yang justru kalau saya simpulkan malah tidak ada perbedaan nyata dan jelas antara kedua model ini. Baik, setelah sekian lama mempelajari kedua model ini, akhirnya saya sampai pada benang merah sebagai aspek pembeda logit dan probit. Sebagaimana ketika kita baca berdasarkan referensi pada umumnya, regresi logistik biner sebuah model statistik yang digunakan untuk memprediksi peluang terjadinya (sukses atau gagal) variabel depe...

Pemodelan Regresi Logistik Biner (Binary Logistic Regression) Logit dengan R

Regresi Logistik Jumpa lagi dengan blog sederhana ini teman-teman. Sebuah blog yang akan membahas mengenai sains data dan seluk beluk terkait penggunaan berbagai macam bahasa pemrograman data mining , data engineering , dan hal terkait sains data lainnya. Baik, dalam kesempatan kali ini, kita akan mencoba untuk sama-sama melangkah sedikit setelah kemarin kita sudah membahas tentang bagaimana pemodelan regresi linier berganda (bagi yang ketinggalan silakan cek tautan berikut ini). Apa itu? Kita akan mencoba bersama belajar bagaimana pemodelan regresi logistik biner atau  yang dikenal dengan istilah logit di dalam R. Sebelumnya kita perlu paham dulu apa itu regresi logistik biner (logit). Menurut Muflihah (2017), regresi logistik biner merupakan cara analisis statistik untuk memaparkan bentuk model korelasi variabel independen terhadap variabel dependen yang berskala nominal atau ordinal. Respon variabel dependen sebesar 1 mewakili kemungkinan sukses dengan probabilitas π(x). Sedangk...

Visualisasi Diagram Chord (Chord Diagram) dengan R

Diagram Chord Kita masih berkutat membahas visualisasi data teman-teman. Kita pelan-pelan saja membahas dan mendalami R. Tenang saja, nantinya kita akan menuju bahasan-bahasan yang lebih lanjut dan mendalam lagi, terutama pemodelan statistik. Mengingat memang fungsi atau manfaat utama penggunaan R ini adalah di Data Mining yang termasuk di dalamnya adalah pemodelan statistik menggunakan data. Baik, kali ini kita kita akan membahas visualisasi yang bisa dibilang merupakan tetangga dekat, atau kata lain bisa kita sebut sahabat karibnya Diagram Sankey yang sebelumnya kita bahas (bagi yang ketinggalan bisa cek di sini saja ). Kalau Diagram Sankey kita gunakan untuk set data yang saling berhubungan dengan set data lainnya, demikian halnya dengan Diagram Chord. Visualisasi jenis ini juga bisa kita gunakan untuk menampilkan set data yang saling berkaitan. Bedanya, kalau Diagam Sankey itu berbentuk alur seperti pipa-pipa air yang berpecah dan menyatu satu dengan yang lain, sedangkan Diagram Ch...

Visualisasi Diagram Sankey (Sankey Diagram) dengan R

Diagram Sankey dengan R Kemarin visualisasi yang kita bahas masih mendasar, kali ini kita akan mencoba belajar bersama bagaimana membuat visualisasi data lanjutan menggunakan Diagram Sankey ( Sankey Diagram ). Sebagian dari kita mungkin belum pernah mendengar jenis visualisasi ini, bisa jadi pula, teman-teman baru tahu dari blog ini. Namun, visualisasi ini sebenarnya telah lama dan banyak digunakan, apalagi kalau teman-teman mencoba menengok keseruan komunitas Tableau publik, di sana, diagram Sankey begitu banyak macamnya, bahkan custome nya aneh dan unik kalau saya katakan. Tapi yang jelas penuh dengan makna atau insight . Diagram Sankey sendiri didefinisikan sebagai diagram aliran hubungan atau keterkaitan antara satu set data dengan set data lainnya dengan karakteristik node dan link . Node adalah titik atau amatan data yang terhubung, sedangkan link merupakan garis, alur, atau jembatan penghubung antar node tadi. Diagram Sankey hingga kini terus dikembangkan karena bermanfaat kh...