더북(TheBook)

다음과 같이 판다스 함수를 호출해 범주형 변수에 원핫 인코딩을 바로 적용할 수 있다.

print(pd.get_dummies(df2))

▲ 그림 1-18 원핫 인코딩 적용 결과

 

1.4.3.2 결측값 보간

앞서 언급했듯이 결측값 보간 작업은 머신 러닝 워크플로에서 매우 중요하다. 실무에서 접하는 실세계 데이터는 대체로 매우 난잡하며 결측값이 많다. 하지만 신경망과 일부 머신 러닝 모델은 결측값을 입력받을 수 없으므로 반드시 전처리 과정을 먼저 거쳐야 한다. 판다스는 결측값을 다루는 손쉬운 방법을 제공한다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.