일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- tunder client
- Linked List
- 집계함수
- 패키지
- fillna
- order by
- iconsiam
- dropna
- 태국
- tail
- append
- 중첩 클래스
- react
- 꽉뚝짝 시장
- gdgm
- React Native
- inteliJ
- 방콕
- preprocessing
- visual studio code
- node.js
- nodemon
- sklearn
- sqld
- ISNA
- 중첩 인터페이스
- 열거 타입
- Package
- extend
- try-catch
Archives
- Today
- Total
ABCD
[pandas]누락 데이터 처리: isna, dropna, fillna 본문
🐢 데이터 프레임 결측치 확인: isna()
🐢 NA: Not Available의 약자로 누락된 데이터, 결측값을 의미.
=NaN(Not a Number), None
null: NA와 동일하게 누락된 데이터를 의미. pandas에서는 해당 개념이 isnull(), notnull()같은 함수 형태로만 나옴.
🐢 데이터 프레임 결측치 제거(행 또는 열이 모두 NA인 경우)
→dropna(how='all', axis=1), dropna(how='all', axis=0)
*dropna( ) : NA 제거 함수
how (NA 삭제 방법) : 'any', 'all'
axis (적용 축) : 0(행), 1(열)
thresh (NA가 아닌 개수) = 숫자(int)
*fillna( ) : NA 값을 채움
1개를 넣으면 모든 NA를 1개의 값으로 변경
컬럼의 수만큼 주면 컬럼 별로 동작
'PROGRAMMING LANGUAGE > PYTHON' 카테고리의 다른 글
[데이터 전처리]sklearn.preprocessing 패키지: 스케일링, 변환 (0) | 2024.06.08 |
---|---|
리스트 더하기, 인자 추가 함수(append, insert, extend) (0) | 2024.06.08 |
[pandas]데이터의 확인: head, tail, print (0) | 2024.06.08 |