더북(TheBook)

누락된 값을 채우는 더 쉬운 방법은 판다스의 fillna 메서드에 매개변수로 누락된 값을 채울 방법을 전달하는 것입니다. 예를 들어 다음 명령을 사용하면 판다스 DataFrame 객체에서 바로 평균값으로 누락된 값을 대체할 수 있습니다.

>>> df.fillna(df.mean())

▲ 그림 4-1 누락된 값을 평균으로 대체하기

Note ≡ 누락된 데이터를 대체하는 다른 방법


최근접 이웃 방식을 사용하여 누락된 특성을 대체하는 KNNImputer를 포함하여 다른 대체 기법에 대해서는 사이킷런의 온라인 문서(https://scikit-learn.org/stable/modules/impute.html)를 참고하세요.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.