더북(TheBook)

4.1.2 누락된 값이 있는 훈련 샘플이나 특성 제외

누락된 데이터를 다루는 가장 쉬운 방법 중 하나는 데이터셋에서 해당 훈련 샘플(행)이나 특성(열)을 완전히 삭제하는 것입니다. 누락된 값이 있는 행은 dropna 메서드를 사용하여 쉽게 삭제할 수 있습니다.3

>>> df.dropna(axis=0)
     A    B    C    D
0  1.0  2.0  3.0  4.0

비슷하게 axis 매개변수를 1로 지정해서 NaN이 하나라도 있는 열을 삭제할 수 있습니다.

>>> df.dropna(axis=1)
      A    B
0   1.0  2.0
1   5.0  6.0
2  10.0 11.0

dropna 메서드는 몇 가지 편리한 매개변수를 제공합니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.