Menggunakan loc[] dan iloc[] di Pandas untuk Seleksi Data Berdasarkan Label dan Posisi

Menggunakan loc[] dan iloc[] di Pandas untuk Seleksi Data Berdasarkan Label dan Posisi

2025-01-22

Pandas adalah salah satu library Python yang populer dan banyak digunakan data scientist dan data analyst untuk analisis data. Salah satu fitur paling kuat dari Pandas adalah kemampuannya untuk memilih dan memanipulasi data dengan mudah. Dua metode yang sering digunakan untuk seleksi data adalah loc[] dan iloc[]. Keduanya memiliki fungsi yang berbeda, dan memahami cara kerjanya sangat penting untuk memaksimalkan penggunaan Pandas.


Apa Itu loc[] dan iloc[]?

loc[] dan iloc[] adalah metode yang digunakan untuk mengakses data dalam DataFrame.

  • loc[] digunakan untuk seleksi berdasarkan label. Ini berarti bisa memilih baris dan kolom dengan menggunakan nama indeks atau nama kolom.
  • iloc[] digunakan untuk seleksi berdasarkan posisi. Ini berarti bisa memilih baris dan kolom dengan menggunakan indeks numerik.

Dengan memahami perbedaan ini, bisa lebih mudah untuk mengakses data yang dibutuhkan.


Menggunakan loc[] untuk Seleksi Berdasarkan Label

Metode loc[] sangat berguna ketika ingin memilih data berdasarkan label. Misalnya, jika memiliki DataFrame dengan kolom yang dinamai 'Nama', 'Umur', dan 'Kota', bisa dengan mudah memilih baris tertentu berdasarkan nama kolom.

Contoh penggunaan loc[]:

import pandas as pd  
  
data = {  
    'Nama': ['Alice', 'Bob', 'Charlie'],  
    'Umur': [25, 30, 35],  
    'Kota': ['Jakarta', 'Bandung', 'Surabaya']  
}  
  
df = pd.DataFrame(data)  
  
# Menggunakan loc untuk memilih baris dengan label  
result = df.loc[0]  # Memilih baris pertama  
print(result)

Output dari kode di atas akan menampilkan data dari baris pertama, yaitu informasi tentang Alice.

Selain itu, loc[] juga bisa digunakan untuk memilih beberapa baris dan kolom sekaligus. Misalnya, jika ingin memilih nama dan kota dari baris pertama dan kedua, bisa dilakukan seperti ini:

result = df.loc[0:1, ['Nama', 'Kota']]  
print(result)


Menggunakan iloc[] untuk Seleksi Berdasarkan Posisi

Di sisi lain, iloc[] memungkinkan untuk memilih data berdasarkan posisi numerik. Ini sangat berguna ketika tidak tahu label dari baris atau kolom, tetapi tahu posisi mereka.

Contoh penggunaan iloc[]:

# Menggunakan iloc untuk memilih baris berdasarkan posisi  
result = df.iloc[1]  # Memilih baris kedua  
print(result)

Output dari kode ini akan menampilkan data dari baris kedua, yaitu informasi tentang Bob.

Sama seperti loc[], iloc[] juga bisa digunakan untuk memilih beberapa baris dan kolom. Misalnya, jika ingin memilih umur dari baris pertama dan kedua, bisa dilakukan seperti ini:

result = df.iloc[0:2, 1]  # Memilih kolom kedua dari baris pertama dan kedua  
print(result)


Menggabungkan Seleksi Baris dan Kolom

Baik loc[] maupun iloc[] bisa digunakan untuk memilih baris dan kolom sekaligus. Ini sangat berguna untuk mendapatkan data yang lebih spesifik.

Contoh penggunaan loc[] untuk memilih nama dari baris pertama:

result = df.loc[0, 'Nama']  # Memilih nama dari baris pertama  
print(result)

Sedangkan untuk iloc[], bisa memilih kota dari baris kedua:

result = df.iloc[1, 2]  # Memilih kota dari baris kedua  
print(result)

Menggunakan loc[] dan iloc[] di Pandas adalah cara yang efektif untuk melakukan seleksi data. Dengan loc[], kita bisa milih data berdasarkan label, sedangkan dengan iloc[], bisa memilih data berdasarkan posisi. Memahami kedua metode ini akan sangat membantu dalam menganalisis dan memanipulasi data dengan lebih efisien


Belajar Data Analyst di Bootcamp Data Analyst Nusacodes. Cek info kelasnya sekarang: Bootcamp Data Analyst