다음은 결측치를 평균으로 채운 출력 결과입니다. x열에 대해 평균값(500.0)으로 NaN 값이 채워져 있는 것을 확인할 수 있습니다.
Unnamed: 0 id tissue class class2 x y r 0 0 mdb000 C CIRC N 535.0 475.0 192.0 1 1 mdb001 A CIRA N 433.0 268.0 58.0 2 2 mdb002 A CIRA I 500.0 NaN NaN 3 3 mdb003 C CIRC B 500.0 NaN NaN 4 4 mdb004 F CIRF I 488.0 145.0 29.0 5 5 mdb005 F CIRF B 544.0 178.0 26.0
이외에도 다음 방법들로 결측치를 처리할 수 있습니다.
• 데이터에 하나라도 NaN 값이 있을 때 행 전체를 삭제
• 데이터가 거의 없는 특성(열)은 특성(열) 자체를 삭제
• 최빈값 혹은 평균값으로 NaN 값을 대체