Allen's 데이터 맛집

[Python] Pandas loc와 iloc에 대해서 본문

카테고리 없음

[Python] Pandas loc와 iloc에 대해서

Allen93 2023. 8. 17. 19:27

pandas는 데이터 전처리, 수집, 분석을 위한 강력한 도구로서, 데이터프레임을 다루는 데 많이 사용됩니다. pd.loc와 pd.iloc은 데이터프레임에서 특정 데이터를 선택하거나 슬라이싱하는 데 사용되는 두 가지 주요한 메서드입니다. 아래 예시를 통해 각각의 차이와 사용법을 이해해보겠습니다.

pd.loc: pd.loc는 라벨(label)을 기반으로 데이터프레임의 특정 행(row) 또는 열(column)을 선택합니다. 라벨은 인덱스의 이름을 의미합니다. 예를 들어, 인덱스가 문자열로 된 경우에 사용됩니다.

import pandas as pd

# 예시 데이터프레임 생성
data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data, index=['row1', 'row2', 'row3'])

# 라벨을 기반으로 행 선택
selected_row = df.loc['row1']
print(selected_row)

# 라벨을 기반으로 열 선택
selected_column = df.loc[:, 'A']
print(selected_column)

# 특정 행과 열 선택
selected_data = df.loc['row2', 'B']
print(selected_data)

 

pd.iloc:
pd.iloc는 정수(integer) 위치를 기반으로 데이터프레임의 특정 행(row) 또는 열(column)을 선택합니다. 인덱스의 순서를 나타냅니다.

 

import pandas as pd

# 예시 데이터프레임 생성
data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)

# 위치를 기반으로 행 선택
selected_row = df.iloc[0]
print(selected_row)

# 위치를 기반으로 열 선택
selected_column = df.iloc[:, 1]
print(selected_column)

# 특정 행과 열 선택
selected_data = df.iloc[1, 0]
print(selected_data)

 


간단히 말해서, pd.loc는 라벨을 기반으로 선택하고, pd.iloc는 정수 위치를 기반으로 선택합니다. 라벨이 문자열로 된 인덱스의 경우 pd.loc를 사용하고, 정수 위치로 인덱싱된 경우 pd.iloc을 사용하는 것이 좋습니다.

이 예시들을 기반으로 pd.loc와 pd.iloc의 차이와 사용법을 블로그에 정리하시면 독자들이 더욱 명확하게 이해할 수 있을 것입니다!

728x90