더북(TheBook)

결측치 처리하기

다음은 모든 행에 결측치가 존재한다면(모든 행이 NaN일 때) 해당 행을 삭제하는 처리 방법입니다.

코드 9-11 결측치 삭제 처리

df = df.dropna(how='all')  ------ 모든 행이 NaN일 때만 삭제
print(df) ------ 데이터 확인(삭제 유무 확인)

다음은 결측치를 삭제 처리하여 출력된 결과입니다. 모든 행에 NaN이 있는 것이 아니라서 삭제된 행이 없습니다.

   Unnamed: 0      id  tissue  class  class2      x      y      r
0           0  mdb000       C   CIRC       N  535.0  475.0  192.0
1           1  mdb001       A   CIRA       N  433.0  268.0   58.0
2           2  mdb002       A   CIRA       I    NaN    NaN    NaN
3           3  mdb003       C   CIRC       B    NaN    NaN    NaN
4           4  mdb004       F   CIRF       I  488.0  145.0   29.0
5           5  mdb005       F   CIRF       B  544.0  178.0   26.0

다음은 결측치가 하나라도 존재한다면(데이터가 하나라도 NaN 값이 있을 때) 해당 행을 삭제하는 처리 방법입니다.

코드 9-12 결측치 삭제 처리

df1 = df.dropna() ------ 데이터에 하나라도 NaN 값이 있으면 행을 삭제
print(df1)
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.