Langsung ke konten utama

Natural Language Processing (NLP) Penerapan Stopwords Bahasa Indonesia dengan R: Topik Sepinya Jalur Pantura Akibat Adanya Tol Trans Jawa

Natural Language Processing : Stopwords Bahasa Indonesia dengan R Halo teman-teman, berjumpa lagi dengan blog sederhana ini. Pada pembahasan sebelumnya, kita telah bersama belajar penerapan stemming teks yang merupakan bagian dari Natural Language Processing (NLP) menggunakan R. Pada perjumpaan kali ini, kita akan melanjutkan perjuangan kita berbagi ilmu mengenai NLP, tepatnya adalah penerapan stopwords Bahasa Indonesia dengan R. Perlu diketahui bahwa di dalam NLP, untuk menambah keluasan dan mempertajam analisis teks, proses stemming teks saja belum cukup. Kita juga perlu membersihkan teks yang relatif atau mutlak tidak bermakna di dalam analisis teks. Biasanya teks yang dieliminasi dalam NLP merupakan kata penghubunga atau konjungsi, atau kata yang berupa ekspresi yang bercampur di dalam data teks, misalkan ekspresi tertawa "wkwk", ekspresi penolakan "gak, nggak, tidak, atau gk", bahasa asing (selain Indonesia), atau juga kata-kata yang tidak memenuhi kaidah ta

Cara Download dan Install Python Jupyter Notebook (Step by Step) untuk Data Science, Big Data, Artificial Intelligence, dan Internet of Things

Download dan Install Python Jupyter Notebook

Halo teman-teman, jumpa kembali dengan blog sederhana ini. Beragam pembahasan mengenai bahasa pemrograman R termasuk bagaimana cara penerapannya dalam pemodelan dan Big Data telah kita lakukan bersama. Tibalah saatnya, kita mulai tahap demi tahap belajar mengenai bahasa pemrograman yang akhir-akhir ini naik daun, yaitu bahasa pemrograman Python dengan GUI Jupyter Notebook.

Sebagai tahap awal mengenal bahasa pemrograman Python, kita akan belajar melakukan download dan dilanjutkan dengan instalasi Python di Windows serta instalasi Jupyter Notebook. Bahasa Python memang sedang naik daun, terlebih dengan banyaknya developer-developer yang bersemangat meningkatkan kapasitas dan kapabilitas dari bahasa pemrograman ini. Python sendiri merupakan salah satu bahasa pemrograman populer yang dapat dimanfaatkan dalam berbagai hal, mulai dari sistem pembelajaran mesin (Machine Learning), merancang sebuah situs atau website yang kalau di R biasa menggunakan R Shiny, termasuk pengujian situs, Data Science, Data Mining, Big Data, Artificial Intelligence (AI), bahkan yang sedang trending yaitu Internet of Things (IoT).

Keunggulan Python sendiri selain dari sisi code-nya yang lebih sederhana dan mudah, juga memiliki kekuatan dari aspek keterbacaannya. Keunggulan ini membuat Python semakin diminati oleh tidak hanya masyarakat dunia, tetapi juga masyarakat Indonesia.

Popularitas bahasa Python dibanding bahasa R

Iseng-iseng saya coba menggunakan Google Trend Index (GTI) untuk melihat popularitas bahasa pemrograman Python dibanding dengan bahasa pemrograman R. Hasilnya, terlihat bahwa sejak 2004 hingga sekarang, masyarakat dunia cenderung lebih menggemari bahasa Python dibanding dengan bahasa R. Kendati kedua jenis bahasa pemrograman ini indeks pencariannya mulai meningkat sekitar 2016, tetapi kecenderungan bahasa pemrograman Python tetap lebih diminati oleh berbagai negara di dunia. Saking powerfull-nya, bahasa Python dalam beberapa bulan terakhir masih menunjukkan tren yang meningkat dibandingkan dengan bahasa pemrograman R.

Popularitas bahasa Python dibanding R di Indonesia dalam 5 tahun terakhir

Di Indonesia sendiri, bahasa pemrograman Python juga lebih diminati oleh masyarakat. Setidaknya dalam kurun waktu 5 tahun terakhir, minat masyarakat Indonesia terhadap bahasa pemrograman Python terus meningkat. Namun sayangnya, penggunaan kedua jenis bahasa pemrograman ini masih tekonsentrasi di Pulau Jawa, khususnya DKI Jakarta.

Baik, itu sedikit mengenai situasi dan kondisi pemanfaatan dari Python dibandingkan dengan bahasa R di dunia dan Indonesia. Selanjutnya, kita akan coba bersama-sama melakukan download dan instalasi Python dengan GUI Jupyter Notebook di Windows. Teman-teman dapat mengikuti beberapa langkah berikut:

Langkah pertama, kita perlu berkunjung ke python.org dengan alamat https://www.python.org/downloads;

Langkah 1

Langkah kedua, kita klik tautan bernarasi, Latest Python 3 Released - Python 3.10.5;

Langkah 2

Setelah kita klik, Python 3.10.5 secara otomatis akan terunduh dan kita tunggu hingga unduhan berhasil secara sempurna;

Langkah 3

Langkah berikutnya adalah meng-klik installer, dalam unggahan kali ini, saya contohkan klik Windows Installer (64-bit) karena komputer yang saya gunakan adalah 64-bit, bagi teman-teman yang komputernya 32-bit bisa menyesuaikan saja;

Langkah 4

Untuk melakukan instalasi, beri centang dulu 2 kota Install launcher for all users dan Add Python 3.10 to PATH, lalu klik Install Now;

Langkah 5

Secara otomatis, proses instalasi berjalan dan kita bisa menunggu sambil minum secangkir kopi atau makan hidangan snack bila ada;

Status selesai install

Instalasi Python 3.10.5 telah selesai dengan sempurna bila muncul warning box Setup was successful; Lalu kita cek versi dari Python yang terinstal dengan mengetikkan code: python --version pada Command Prompt komputer kita, bisa mengetik pada Windows cmd saja lalu kita ketikan codenya;

Melihat versi dari Python yang telah terinstal

Setelah versi Python telah terlihat, kita lanjutkan dengan menginstal GUI yang akan kita pakai untuk menjalankan Python supaya lebih interaktif. Teman-teman juga bisa melakukan instalasi menggunakan Anaconda atau Miniconda juga, dan di dalam Anaconda juga tersedia instalasi Jupyter Notebook; Adapun untuk menginstal Jupyter Notebook, kita dapat menggunakan code: python -m pip install jupyter pada Command Prompt;

Instalasi jupyter notebook dalam Python

Bila di akhir dari instalasi terdapat warning, kita dapat ikuti saja warning tersebut. Misalkan bila perlu melakukan upgrade dari pip, kita bisa menuliskan code: -m pip install --upgrade pip;

Status jupyter notebook telah terinstal dalam Python

Itu opsional ya teman-teman, kita bisa saja tidak melakukan upgrade dari pip; Berikutnya kita akan coba panggil Jupyter Notebook yang telah terinstall, caranya pergi ke Command Prompt dan mengetikkan code: jupyter notebook;

Membuka jupyter notebook dalam Python

Secara otomatis, jendela awal Jupyter Notebook akan terbuka sebagaimana gambar berikut:

Status jupyter notebook telah terbuka dengan baik

Untuk membuat halaman kerja baru atau file kerja bari di Jupyter Notebook, kita cukup klik New - Python 3 (ipykernel);

Membuat dan membuka lembar kerja baru jupyter notebook dalam Python 3

File kerja baru kemudian terbentuk dan kita siap melakukan aksi coding menggunakan bahasa pemrograman Python, mengcustome Markdownnya, melakukan modelling, olah Big Data, Web Scraping, Web Crawling, serta Data Wrangling, Natural Language Processing (NLP), serta membuat Deep Learning Model, Artificial Intelligence dan penerapan Internet of Things (IoT).

Jupyter notebook sudah siap digunakan untuk mengolah data

Demikian sedikit berbagi kita bagaimana melakukan download dan instalasi paket program Jupyter Notebook dalam Python 3.10.5. Selamat memahami dan mempraktikkan!

Komentar

Postingan populer dari blog ini

Pemodelan Autoregressive Integrated Moving Average (ARIMA Model) dengan R

ARIMA dengan R Jumpa lagi teman-teman, sebelumnya saya mohon maaf karena kemarin tidak sempat membuat unggahan terbaru di blog ini. Baik, sebelumnya kita telah mengulas tentang pemodelan Geographically Weigthed Regression (GWR) dengan R. Kali ini, kita akan melanjutkan belajar bersama mengenai pemodelan yang tak asing lagi dan populer hingga kini, yaitu pemodelan Autoregressive Integrated Moving Average (ARIMA). Kita akan membahas ARIMA secara langsung tanpa membahas AR dan MA secara tersendiri mengingat pada dasarnya ARIMA adalah model perpaduan antara model AR dengan order p , MA dengan order q dan aspek differencing dengan order d . Artinya, ketika kita mendengar istilah AR(1), maka sebenarnya itu adalah ARIMA(1, 0, 0), ketika kita mendengar ARI(1,1), maka aslinya itu ARIMA(1, 1, 0), atau bila mendengar MA(3), itu sebenarnya ARIMA(0, 0, 3) atau IMA(2,1) sebenarnya adalah ARIMA(0, 2, 1). Data runtun waktu atau time series merupakan salah satu jenis data yang hingga kini banyak digun

Machine Learning: Memahami Reinforcement Learning

Reinforcement Learning Halo teman-teman, pada pembahasan sebelumnya, kita telah berusaha memahami mengenai supervised learning dan unsupervised learning . Sebelum lanjut ke pemodelan statistik selanjutnya, ada baiknya kita membahas tentang satu lagi jenis algoritma machine learning yang akhir-akhir ini banyak digunakan dalam membentuk artificial intelligence (AI), yaitu algoritma reinforcement learning . Kita ke pengertian berdasarkan studi literatur daring ( online ) dulu teman-teman. Saya coba mengambil salah satu pengertian reinforcement learning, misalkan dari situsnya Algoritma, menyatakan bahwa reinforcement learning merupakan algoritma yang diterapkan untuk pembelajaran mesin ( machine learning ) sedemikian rupa sehingga dapat menentukan aksi yang tepat dan pada akhirnya sebuah program dapat bekerja secara otomatis memberikan hasil atau putusan yang benar. Lebih lanjut dalam situs algoritma mengangkat sebuah perumpamaan reinforcement learning dengan menggunakan proses penugasan

Machine Learning: Perbedaan Supervised Learning dan Unsupervised Learning

Perbedaan supervised learning dan unsupervised learning Halo teman-teman, kemarin kita telah mengawali bahasan mengenai salah satu anggota dari Machine Learning sekaligus merupakan contoh dari algoritma supervised learning , yaitu Naive Bayes Classifier (NBC). Akhir-akhir ini, dunia sains data dihebohkan dengan berbagai istilah statistik yang berkaitan erat dengan komputasi atau komputasi statistik, yaitu supervised learning dan unsupervised learning . Sebenarnya ada lagi istilah baru dan cukup makin sulit menyederhanakan definisinya, yaitu reinforcement learning , tapi khusus reinforcement learning nanti akan kita bahas tersendiri karena kita mulai bersinggungan dengan Artificial Intelligence atau kecerdasan buatan. Jujur, saya mengakui bahwa tidak semua dari kita memiliki latar belakang apalagi pakar teknologi informasi (IT). Sehingga, bila kita cermati bahasan-bahasan atau istilah komputasi statistik, sains data, atau data engineering , kita mungkin akan sejenak loading , bahkan s