Eksplorasi Data: Cara Membuat Pivot Table dengan Python

Pivot table dengan Python

Halo teman-teman, kita akan lanjutkan ya pembahasan bahasa pemrograman Python. Kalau sebelumnya kita telah memahas bersama bagaimana melakukan import data ke dalam Python Jupyter Notebook serta mengulik data menggunakan Pandas, kali ini kita masih tetap menggunakan package Pandas.

Kita akan coba membuat sebuah data sendiri (generate) kemudian kita coba membuat pivot table data data frame yang telah kita buat. Teman-teman dapat juga membangkitkan data sendiri sesuai keinginan, dalam unggahan ini saya coba membangkitkan data mengenai jumlah buku yang dibaca menurut bulan dan judul bukunya. Adapun nama-nama buku dalam data berikut merupakan buku yang berhasil saya tulis dan saya terbitkan. Bagi teman-teman yang berminat, bisa memesannya melalui tautan berikut.

Sebelum melakukan data manipulation dengan menciptakan pivot table, teman-teman perlu mengaktifkan package Pandas terlebih dahulu. Package ini sebagaimana yang pernah saya katakan, mirip dengan package dplyr di R secara fungsi. Setelah diaktifkan, kita dapat membuat pivot table dengan mengikuti beberapa code berikut:

#Aktivasi package Pandas
import pandas as pd

#Generate Data sendiri
hargabuku = {'Judul':['Pengantar Statistika Dasar','Visualisasi Data dengan Tableau','Kalkulus Dasar',
                     'Kalkulus Dasar','Pengantar Statistika Dasar','Visualisasi Data dengan Tableau',
                     'Visualisasi Data dengan Tableau','Kalkulus Dasar','Kalkulus Dasar','Pengantar Statistika Dasar'],
             'Bulan':[1,1,2,3,1,4,3,2,1,6],'Dibaca_kali':[12,24,30,17,20,22,50,21,45,44]}
#Membuat data frame
dfbuku = pd.DataFrame(hargabuku, columns = ['Judul', 'Bulan', 'Dibaca_kali'])
print(dfbuku)

Data awal sebagai bahan pivot table dengan Python

#Pivot Table:menampilkan jumlah dibaca menurut judul buku
pivot = dfbuku.pivot_table(index = ['Judul'], values = ['Dibaca_kali'], aggfunc = 'sum')
print(pivot)

Pivot table: jumlah dibaca menurut judul buku

#Pivot Table:menampilkan jumlah dibaca menurut jumlah bulan
pivot = dfbuku.pivot_table(index = ['Judul'], values = ['Bulan'], aggfunc = 'count')
print(pivot)

Jumlah bulan dibaca menurut judul buku

#Pivot Table:menampilkan rata-rata dibaca menurut judul buku
pivot = dfbuku.pivot_table(index = ['Judul'], values = ['Dibaca_kali'], aggfunc = 'mean')
print(pivot)

Rata-rata dibaca menurut judul buku

#Pivot Table:menampilkan jumlah dibaca menurut judul buku dan bulan
pivot = dfbuku.pivot_table(index = ['Judul','Bulan'], values = ['Dibaca_kali'], aggfunc = 'sum')
print(pivot)

Jumlah dibaca menurut judul buku dan bulan

#Pivot Table:menampilkan rata-rata dibaca menurut judul buku dan bulan
pivot = dfbuku.pivot_table(index = ['Judul','Bulan'], values = ['Dibaca_kali'], aggfunc = 'mean')
print(pivot)

Rata-rata dibaca menurut judul buku dan bulan

#Pivot Table:menampilkan rata-rata dibaca menurut judul buku dan bulan serta diurutkan dari rata-rata tertinggi ke terendah
pivot = dfbuku.pivot_table(index = ['Judul','Bulan'], values = ['Dibaca_kali'], aggfunc = 'mean')
pivot = pivot.sort_values(by = "Dibaca_kali", ascending = False)
print(pivot)

Rata-rata dibaca urut dari tertinggi ke terendah menurut judul buku dan bulan

#Mengganti nama kolom Dibaca_kali menjadi Rata_rata_dibaca
pivot.rename(columns = {'Dibaca_kali':'Rata-rata_dibaca'}, inplace =True)
print(pivot)

Mengganti nama kolom dibaca_kali menjadi rata-rata_dibaca

Demikian sedikit sharing kita mengenai bagaimana membuat pivot table menggunakan package Pandas pada Python Jupyter Notebook. Nantikan unggahan berikutnya, selamat memahami dan mempraktikkan!
Add Comments


EmoticonEmoticon