Langsung ke konten utama

Postingan

Menampilkan postingan dari Juli, 2022

Natural Language Processing (NLP) Penerapan Stopwords Bahasa Indonesia dengan R: Topik Sepinya Jalur Pantura Akibat Adanya Tol Trans Jawa

Natural Language Processing : Stopwords Bahasa Indonesia dengan R Halo teman-teman, berjumpa lagi dengan blog sederhana ini. Pada pembahasan sebelumnya, kita telah bersama belajar penerapan stemming teks yang merupakan bagian dari Natural Language Processing (NLP) menggunakan R. Pada perjumpaan kali ini, kita akan melanjutkan perjuangan kita berbagi ilmu mengenai NLP, tepatnya adalah penerapan stopwords Bahasa Indonesia dengan R. Perlu diketahui bahwa di dalam NLP, untuk menambah keluasan dan mempertajam analisis teks, proses stemming teks saja belum cukup. Kita juga perlu membersihkan teks yang relatif atau mutlak tidak bermakna di dalam analisis teks. Biasanya teks yang dieliminasi dalam NLP merupakan kata penghubunga atau konjungsi, atau kata yang berupa ekspresi yang bercampur di dalam data teks, misalkan ekspresi tertawa "wkwk", ekspresi penolakan "gak, nggak, tidak, atau gk", bahasa asing (selain Indonesia), atau juga kata-kata yang tidak memenuhi kaidah ta...

Natural Language Processing (NLP): Stemming Kata dengan R (Step by Step)

  Natural Language Processing (NLP) dengan R Halo teman-teman, bertemu kembali dengan blog sederhana ini. Kemarin kita telah membahas dan mempratikkan bersama bagaimana membuat pivot table dengan Python dan NLP membersihkan teks dengan R, kali ini kita akan kembali membahas mengenai Natural Language Processing (NLP) dengan R. Pada bahasan NLP kemarin, kita sampai pada praktik membersihkan teks dari unsur-unsur yang tidak diperlukan untuk analisis data teks ( Text Mining ). Sekarang saatnya kita meneruskan NLP itu lebih lanjut, yaitu bagaimana menerapkan stemming sebuah teks atau sekumpulan teks menggunakan R. Dalam melakukan analisis sekumpulan teks, imbuhan sebuah kata memang berarti, namun, dalam rangka menyederhanakan proses analisis sehingga lebih berkualitas, kita juga perlu melakukan ekstraksi sekumpulan kata dalam sebuah teks menjadi himpunan kata-kata dasar atau kata tanpa imbuhan apapun. Mengapa kita perlu mengekstrak kata dasar dari sekumpulan kata berimbuhan ini? Jel...

Eksplorasi Data: Cara Membuat Pivot Table dengan Python

Pivot table dengan Python Halo teman-teman, kita akan lanjutkan ya pembahasan bahasa pemrograman Python. Kalau sebelumnya kita telah memahas bersama bagaimana melakukan import data ke dalam Python Jupyter Notebook serta mengulik data menggunakan Pandas, kali ini kita masih tetap menggunakan package Pandas. Kita akan coba membuat sebuah data sendiri ( generate ) kemudian kita coba membuat pivot table data data frame yang telah kita buat. Teman-teman dapat juga membangkitkan data sendiri sesuai keinginan, dalam unggahan ini saya coba membangkitkan data mengenai jumlah buku yang dibaca menurut bulan dan judul bukunya. Adapun nama-nama buku dalam data berikut merupakan buku yang berhasil saya tulis dan saya terbitkan. Bagi teman-teman yang berminat, bisa memesannya melalui tautan berikut . Sebelum melakukan data manipulation dengan menciptakan pivot table , teman-teman perlu mengaktifkan package Pandas terlebih dahulu. Package ini sebagaimana yang pernah saya katakan, mirip dengan pac...

Natural Language Processing (NLP): Membersihkan Teks Tweets Rencana Kenaikan Tiket Borobudur dengan R

Natural Language Processing (NLP) dengan R Halo teman-teman, bertemu kembali dengan blog sederhana ini. Kita kemarin telah membahas awalan penggunaan Python dalam mengolah data. Kali ini, kita coba break sejenak dari Python untuk kembali meneruskan belajar kita mengenai R. Ke depan, kita kemungkinan akan sering berselang-seling membahas R dan Python mengingat memang kedua bahasa pemrograman ini sedang naik daun saat ini. Baik, di R kita akan melanjutkan pembahasan mengenai salah satu cabang dari Data Science , yaitu Natural Language Processing atau yang biasa disingkat NLP. Apa itu NLP? Jadi kalau menurut beberapa referensi yang saya baca, NLP merupakan produk dari Artificial Intelligence (AI) yang digunakan dalam proses interaksi antara manusia dengan mesin. Mesin yang dimaksud dalam pembahasan ini bisa berbentuk komputer, robot, atau bentuk lainnya. Istilah Natural Language atau bahasa alamiah yang dimaksud dalam NLP merupakan bahasa yang biasa digunakan oleh manusia sehari-hari. Ra...

Eksplorasi Data: Filter, Subset, Transpose dengan Pandas Python (Step by Step)

Eksplorasi data dengan Python Halo teman-teman, kita bertemu kembali untuk berbagi mengenai pemanfaatan Python dengan GUI Jupyter Notebook di blog sederhana ini. Pada unggahan sebelumnya, kita telah bersama-sama belajar dan berbagi mengenai bagaimana melakukan download , instalasi Python Jupyter Notebook, import data Excel ke dalam Python serta bagaimana melakukan import data berekstensi CSV dalam Python, maka kali ini kita akan melanjutkan berbagi mengenai bagaimana kita menggunakan fungsi filter dan transpose data dengan package Pandas. Di era Data Science , Big Data, dan maraknya penggunaan Machine Learning , kita akan dihadapkan pada istilah-istilah baru, salah satunya adalah data wrangling . Data wrangling merupakan sebuah proses tak terpisahkan dalam olah hingga analisis data. Aktivitas ini selain meliputi bagaimana kita memanajemen sebuah data, juga meliputi bagaimana kita menciptakan transformasi-transformasi untuk membentuk data turunan atau subset dari data utama (induk)....