EDA Exploratory Data

EDA, atau Exploratory Data Analysis, adalah proses penyelidikan dan pemahaman awal terhadap data sebelum menerapkan model atau analisis yang lebih lanjut. Pandas adalah pustaka Python yang sangat berguna untuk melakukan EDA, karena menyediakan struktur data seperti DataFrame yang mempermudah manipulasi dan analisis data. Dan berikut adalah Contoh penggunaannya.

 

Struktur Data
Gunakan head() dan info() untuk melihat beberapa baris awal dan informasi tentang tipe data dan missing values.

import pandas as pd

df = pd.read_csv(‘data.csv’)
print(df.head())
print(df.info())

Statistik Describe
Gunakan describe() untuk mendapatkan ringkasan statistik deskriptif dari data numerik.

print(df.describe())

 

Handling Missing

Identifikasi dan tangani nilai yang hilang menggunakan isna(), fillna(), atau dropna().

print(df.isna().sum())
df = df.dropna() # Contoh: menghapus baris dengan nilai yang hilang

 

 

 

 

Loading

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top