ABCD

[pandas]누락 데이터 처리: isna, dropna, fillna 본문

PROGRAMMING LANGUAGE/PYTHON

[pandas]누락 데이터 처리: isna, dropna, fillna

카메사마 2024. 6. 8. 22:16

🐢 데이터 프레임 결측치 확인: isna()

 

🐢 NA: Not Available의 약자로 누락된 데이터, 결측값을 의미.

=NaN(Not a Number), None

null: NA와 동일하게 누락된 데이터를 의미. pandas에서는 해당 개념이 isnull(), notnull()같은 함수 형태로만 나옴.

 

🐢 데이터 프레임 결측치 제거(행 또는 열이 모두 NA인 경우)

→dropna(how='all', axis=1), dropna(how='all', axis=0)

 

*dropna( ) : NA 제거 함수

how (NA 삭제 방법) : 'any', 'all'

axis (적용 축) : 0(행), 1(열)

thresh (NA가 아닌 개수) = 숫자(int)

 

*fillna( ) : NA 값을 채움

1개를 넣으면 모든 NA를 1개의 값으로 변경

컬럼의 수만큼 주면 컬럼 별로 동작