전체 데이터 대비 결측치 비율을 확인해 봅시다.
코드 9-10 결측치 비율
df.isnull().sum() / len(df))
다음은 결측치 비율에 대한 출력 결과입니다.
Unnamed: 0 0.000000 id 0.000000 tissue 0.000000 class 0.000000 class2 0.000000 x 0.333333 y 0.333333 r 0.333333 dtype: float64)
결측치 처리하기
다음은 모든 행에 결측치가 존재한다면(모든 행이 NaN일 때) 해당 행을 삭제하는 처리 방법입니다.
코드 9-11 결측치 삭제 처리
df = df.dropna(how='all') ------ 모든 행이 NaN일 때만 삭제
print(df) ------ 데이터 확인(삭제 유무 확인))