Pandas adalah salah satu library Python yang populer dan banyak digunakan data scientist dan data analyst untuk analisis data. Salah satu fitur paling kuat dari Pandas adalah kemampuannya untuk memilih dan memanipulasi data dengan mudah. Dua metode yang sering digunakan untuk seleksi data adalah loc[]
dan iloc[]
. Keduanya memiliki fungsi yang berbeda, dan memahami cara kerjanya sangat penting untuk memaksimalkan penggunaan Pandas.
loc[]
dan iloc[]
adalah metode yang digunakan untuk mengakses data dalam DataFrame.
loc[]
digunakan untuk seleksi berdasarkan label. Ini berarti bisa memilih baris dan kolom dengan menggunakan nama indeks atau nama kolom.iloc[]
digunakan untuk seleksi berdasarkan posisi. Ini berarti bisa memilih baris dan kolom dengan menggunakan indeks numerik.Dengan memahami perbedaan ini, bisa lebih mudah untuk mengakses data yang dibutuhkan.
Metode loc[]
sangat berguna ketika ingin memilih data berdasarkan label. Misalnya, jika memiliki DataFrame dengan kolom yang dinamai 'Nama', 'Umur', dan 'Kota', bisa dengan mudah memilih baris tertentu berdasarkan nama kolom.
Contoh penggunaan loc[]
:
import pandas as pd
data = {
'Nama': ['Alice', 'Bob', 'Charlie'],
'Umur': [25, 30, 35],
'Kota': ['Jakarta', 'Bandung', 'Surabaya']
}
df = pd.DataFrame(data)
# Menggunakan loc untuk memilih baris dengan label
result = df.loc[0] # Memilih baris pertama
print(result)
Output dari kode di atas akan menampilkan data dari baris pertama, yaitu informasi tentang Alice.
Selain itu, loc[]
juga bisa digunakan untuk memilih beberapa baris dan kolom sekaligus. Misalnya, jika ingin memilih nama dan kota dari baris pertama dan kedua, bisa dilakukan seperti ini:
result = df.loc[0:1, ['Nama', 'Kota']]
print(result)
Di sisi lain, iloc[]
memungkinkan untuk memilih data berdasarkan posisi numerik. Ini sangat berguna ketika tidak tahu label dari baris atau kolom, tetapi tahu posisi mereka.
Contoh penggunaan iloc[]
:
# Menggunakan iloc untuk memilih baris berdasarkan posisi
result = df.iloc[1] # Memilih baris kedua
print(result)
Output dari kode ini akan menampilkan data dari baris kedua, yaitu informasi tentang Bob.
Sama seperti loc[]
, iloc[]
juga bisa digunakan untuk memilih beberapa baris dan kolom. Misalnya, jika ingin memilih umur dari baris pertama dan kedua, bisa dilakukan seperti ini:
result = df.iloc[0:2, 1] # Memilih kolom kedua dari baris pertama dan kedua
print(result)
Baik loc[]
maupun iloc[]
bisa digunakan untuk memilih baris dan kolom sekaligus. Ini sangat berguna untuk mendapatkan data yang lebih spesifik.
Contoh penggunaan loc[]
untuk memilih nama dari baris pertama:
result = df.loc[0, 'Nama'] # Memilih nama dari baris pertama
print(result)
Sedangkan untuk iloc[]
, bisa memilih kota dari baris kedua:
result = df.iloc[1, 2] # Memilih kota dari baris kedua
print(result)
Menggunakan loc[]
dan iloc[]
di Pandas adalah cara yang efektif untuk melakukan seleksi data. Dengan loc[]
, kita bisa milih data berdasarkan label, sedangkan dengan iloc[]
, bisa memilih data berdasarkan posisi. Memahami kedua metode ini akan sangat membantu dalam menganalisis dan memanipulasi data dengan lebih efisien
Belajar Data Analyst di Bootcamp Data Analyst Nusacodes. Cek info kelasnya sekarang: Bootcamp Data Analyst