더북(TheBook)

전체 데이터 대비 결측치 비율을 확인해 봅시다.

코드 9-10 결측치 비율

df.isnull().sum() / len(df))

다음은 결측치 비율에 대한 출력 결과입니다.

Unnamed: 0     0.000000
id             0.000000
tissue         0.000000
class          0.000000
class2         0.000000
x              0.333333
y              0.333333
r              0.333333
dtype: float64)

 

결측치 처리하기

다음은 모든 행에 결측치가 존재한다면(모든 행이 NaN일 때) 해당 행을 삭제하는 처리 방법입니다.

코드 9-11 결측치 삭제 처리

df = df.dropna(how='all') ------ 모든 행이 NaN일 때만 삭제
print(df) ------ 데이터 확인(삭제 유무 확인))
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.