더북(TheBook)

원핫 인코딩으로 변환한 각 이진 변수는 1 또는 0 값을 가진다. 이진 변수 값이 1이면 범주형 변수 값이 이 이진 변수에 해당하는 범주라는 의미다. 반대로 다른 범주라면 이진 변수 값은 0이 된다. 이러한 변환 과정을 직접 구현하려면 꽤 번거롭겠지만 판다스 함수로 쉽게 적용할 수 있다. 먼저 그림 1-16의 예시 데이터를 판다스 DataFrame으로 만들자.

df2 = pd.DataFrame({'Day': ['Monday','Tuesday','Wednesday', 'Thursday','Friday','Saturday', 'Sunday']})

이 DataFrame을 출력한 결과는 다음 그림 1-17과 같다.

▲ 그림 1-17 원핫 인코딩에 사용할 예시 데이터

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.