Fungsi strsplit() di R

Fungsi strsplit di R

Teman-teman pasti pernah menghadapi permasalah data teks dan perlu untuk memisah per kata atau suku kata. Hal serupa juga akan kita temui di R, di mana kita akan dihadapkan pada persoalan data teks yang sangat acak bahkan tidak tertata secara rapih. Antar suku kata atau kata dengan angka tergabung menjadi satu tidak beraturan.

Fungsi strsplit() merupakan salah satu fungsi standar di dalam R yang bisa kita manfaatkan untuk memecah sebuah kalimat atau teks atau campuran menjadi kata per kata, atau bahkan huruf per huruf. Kalau di excel mirip dengan fungsi Text to Columns dengan delimited tertentu (misalkan space atau spasi) seperti tampilan berikut:

Split data di excel dengan fungsi Text to Columns

Fungsi strsplit() di R dengan cepat menghasilkan output berupa teks atau karakter yang terpecah berdasarkan delimited tertentu sesuai kebutuhan. Adapun tipe output dari fungsi ini berupa data list dengan tahapan praktik dengan code berikut:

Code:

#Split atau memecah sebuah kalimat dengan pemisah spasi " "
split_spasi <- strsplit("Halo Nama Channel Youtube Saya Sains Data", split=" ")

#Melihat hasilnya
split_spasi

Hasil:

[[1]]
[1] "Halo"    "Nama"    "Channel" "Youtube" "Saya"    "Sains"   "Data"

Code:

#Split atau memecah sebuah kalimat menjadi kata per kata dengan split titik (.)
split_enter <- strsplit("Jangan lupa terus menyimak postingan terbau jokoding.blogspot.com", split = "[.]")

#melihat hasilnya
split_enter

Hasil:

[[1]]
[1] "Jangan lupa terus menyimak postingan terbau jokoding"
[2] "blogspot"                                            
[3] "com"

Code:

#Split atau memecah sebuah kalimat menjadi kata per kata dengan split karakter |
split_karakter <- strsplit("Jangan|lupa|terus|menyimak|postingan|terbaru|jokoding|blogspot|com", split = "[|]")

#melihat hasilnya
split_karakter

Hasil:

[[1]]
[1] "Jangan"    "lupa"      "terus"     "menyimak"  "postingan" "terbaru"   "jokoding"  "blogspot"  "com"

Code:

#Split atau memecah sebuah kalimat menjadi kata per kata dengan split per huruf
split_huruf <- strsplit("Jangan lupa terus menyimak postingan terbaru|jokoding blogspot com", split = "")

#melihat hasilnya
split_huruf

Hasil:

[[1]]
 [1] "J" "a" "n" "g" "a" "n" "|" "l" "u" "p" "a" "|" "t" "e" "r" "u" "s" "|" "m" "e" "n" "y" "i" "m" "a" "k" "|"
[28] "p" "o" "s" "t" "i" "n" "g" "a" "n" "|" "t" "e" "r" "b" "a" "r" "u" "|" "j" "o" "k" "o" "d" "i" "n" "g" "|"
[55] "b" "l" "o" "g" "s" "p" "o" "t" "|" "c" "o" "m"

Oke, demikian sedikit ulasan bagaimana kita memecah kalimat atak data teks dengan menggunakan fungsi strsplit() di R yang mirip fungsi dengan excel. Jangan lupa untuk share, tanya-tanya di kolom komentar, dan menyimak unggahan berikutnya. Semoga bermanfaat.

Add Comments


EmoticonEmoticon