더북(TheBook)

Note ≡ 판다스 데이터프레임을 사용한 간편한 데이터 처리


사이킷런이 넘파이 배열을 다룰 수 있도록 개발되었지만 이따금 판다스의 DataFrame을 사용하여 데이터를 전처리하는 것이 더 편리합니다. 대부분의 사이킷런 함수가 DataFrame 객체 입력을 지원하지만 사이킷런 API에서는 넘파이 배열 처리가 더 성숙하기 때문에 가능하면 넘파이 배열을 사용하는 것이 좋습니다.2 사이킷런의 추정기에 주입하기 전에 DataFramevalues 속성을 사용하여 언제나 넘파이 배열을 얻을 수 있습니다.

>>> df.values
array([[  1.,   2.,   3.,   4.],
       [  5.,   6.,  nan,   8.],
       [ 10.,  11.,  12.,  nan]])
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.