EDA, atau Exploratory Data Analysis, adalah proses penyelidikan dan pemahaman awal terhadap data sebelum menerapkan model atau analisis yang lebih lanjut. Pandas adalah pustaka Python yang sangat berguna untuk melakukan EDA, karena menyediakan struktur data seperti DataFrame yang mempermudah manipulasi dan analisis data. Dan berikut adalah Contoh penggunaannya.
Struktur Data
Gunakan head()
dan info()
untuk melihat beberapa baris awal dan informasi tentang tipe data dan missing values.
import pandas as pd
df = pd.read_csv(‘data.csv’)
print(df.head())
print(df.info())
Statistik Describe
Gunakan describe()
untuk mendapatkan ringkasan statistik deskriptif dari data numerik.
print(df.describe())
Handling Missing
Identifikasi dan tangani nilai yang hilang menggunakan isna()
, fillna()
, atau dropna()
.
print(df.isna().sum())
df = df.dropna() # Contoh: menghapus baris dengan nilai yang hilang