Cara Import Data Excel ke dalam Python (Step by Step)

Import Excel dalam Python

Halo teman-teman, bertemu lagi dengan blog sederhana ini. Kita sekalian telah belajar bagaimana melakukan download dan install program Python dan Jupyter Notebook. Kali ini, kita akan membuka lembaran kedua dari pembahasan Python dengan bagaimana cara import data Excel ke dalam Python.

Pada bahasan ini, kita akan coba menggunakan data yang saya telah saya siapkan. Data ini merupakan data hasil web scraping situs jual beli hewan ternak termasuk pakan ternak. Data ini menarik mengingat belakangan ini, banyak masyarakat antusias dengan hewan peliharaan, khususnya di Indonesia. Efek Pandemi Covid-19 yang menerpa lebih dari 2 tahun membuat kebiasaan baru atau selama Work from Home (WFH) terbawa hingga sekarang. Penyuka hewan peliharaan seperti kucing, kelinci, burung, merupakan kebiasaan atau bisa pula menjadi hobi baru seseorang. Tidak hanya itu, ke depan saya juga tertarik mengamati data-data jual beli sepeda (onthel dan pancal) karena kebiasaan bersepeda ini juga menjadi kegemaran baru pasca puncak pandemi.

Baik, itu sekilas gambaran mengenai data yang akan kita gunakan. Di dalam Python, ketika kita akan mengimport data, ada beberapa perbedaan mendasar dengan ketika menggunakan R. Perbedaan mendasar itu selain jenis package yang digunakan berbeda, kita juga harus paham bagaimana format pemanggilan datanya. Kalau di R, format import dari komputer selalu menggunakan tanda slash "/" untuk mencari tempat dari data disimpan, sedangkan dalam Python, kita menggunakan tanda "\\", tinggal menambahkan "\" satu lagi alamat file hasil ekstrak di komputer.

Cara memperoleh alamat file yang akan diimport dalam Python

Dari hasil copy dan paste: C:\Users\56848\data kalau di Python diubah menjadi C:\\Users\\56848\\data\\ternak.xlsx. Ekstensi *xlsx kita gunakan setelah nama dari file yang akan diimport ke dalam Python. Sedangkan di R, kita justru membalikkan tanda "\" menjadi "/" atau menjadi: C:/Users/56848/data/ternak.xlsx. Inilah perbedaan paling dasar dari Python dan R saat proses import data.

Setelah mengetahui perbedaan itu, selanjutnya kita akan langsung praktikkan cara import data Excel ke dalam Python. Adapun datanya bisa teman-teman unduh pada tautan berikut.

Berikutnya, untuk melakukan praktik import data ke dalam Python Jupyter Notebook, kita dapat mengikuti beberapa code berikut:

#Melakukan instalasi package dengan pip install (nama package)
!pip install pandas

Requirement already satisfied: pandas in c:\users\56848\appdata\local\programs\python\python310\lib\site-packages (1.4.1)
Requirement already satisfied: numpy>=1.21.0 in c:\users\56848\appdata\local\programs\python\python310\lib\site-packages (from pandas) (1.22.3)
Requirement already satisfied: pytz>=2020.1 in c:\users\56848\appdata\local\programs\python\python310\lib\site-packages (from pandas) (2021.3)
Requirement already satisfied: python-dateutil>=2.8.1 in c:\users\56848\appdata\local\programs\python\python310\lib\site-packages (from pandas) (2.8.2)
Requirement already satisfied: six>=1.5 in c:\users\56848\appdata\local\programs\python\python310\lib\site-packages (from python-dateutil>=2.8.1->pandas) (1.16.0)
WARNING: You are using pip version 22.0.4; however, version 22.1.2 is available.
You should consider upgrading via the 'C:\Users\56848\AppData\Local\Programs\Python\Python310\python.exe -m pip install --upgrade pip' command.

#Aktivasi package pandas dengan cara import
import pandas as pd

#Instalasi package openpyxl untuk kebutuhan import data berekstensi *xlsx atau file Excel
!pip install openpyxl

Requirement already satisfied: openpyxl in c:\users\56848\appdata\local\programs\python\python310\lib\site-packages (3.0.10)
Requirement already satisfied: et-xmlfile in c:\users\56848\appdata\local\programs\python\python310\lib\site-packages (from openpyxl) (1.1.0)
WARNING: You are using pip version 22.0.4; however, version 22.1.2 is available.
You should consider upgrading via the 'C:\Users\56848\AppData\Local\Programs\Python\Python310\python.exe -m pip install --upgrade pip' command.

#Import data Excel
df = pd.read_excel("C:\\Users\\56848\\data\\ternak.xlsx")

 #Melihat 5 data teratas
df.head()

Hasil dari 5 data teratas

#Melihat 10 data teratas
df.head(10)


 

10 data teratas

#Melihat 5 data terbawah
df.tail(5)

5 data terbawah

#Analisis deskriptif data
df.describe()

Deskriptif data

Demikian sedikit sharing kita bagaimana melakukan import data Excel ke dalam Python dan melakukan identifikasi awal terhadap data. Selamat memahami dan mempraktikkan!

Add Comments


EmoticonEmoticon