Note ≡ 판다스 데이터프레임을 사용한 간편한 데이터 처리
사이킷런이 넘파이 배열을 다룰 수 있도록 개발되었지만 이따금 판다스의 DataFrame을 사용하여 데이터를 전처리하는 것이 더 편리합니다. 대부분의 사이킷런 함수가 DataFrame 객체 입력을 지원하지만 사이킷런 API에서는 넘파이 배열 처리가 더 성숙하기 때문에 가능하면 넘파이 배열을 사용하는 것이 좋습니다.2 사이킷런의 추정기에 주입하기 전에 DataFrame의 values 속성을 사용하여 언제나 넘파이 배열을 얻을 수 있습니다.
>>> df.values
array([[ 1., 2., 3., 4.],
[ 5., 6., nan, 8.],
[ 10., 11., 12., nan]])