원핫 인코딩으로 변환한 각 이진 변수는 1 또는 0 값을 가진다. 이진 변수 값이 1이면 범주형 변수 값이 이 이진 변수에 해당하는 범주라는 의미다. 반대로 다른 범주라면 이진 변수 값은 0이 된다. 이러한 변환 과정을 직접 구현하려면 꽤 번거롭겠지만 판다스 함수로 쉽게 적용할 수 있다. 먼저 그림 1-16의 예시 데이터를 판다스 DataFrame으로 만들자.
df2 = pd.DataFrame({'Day': ['Monday','Tuesday','Wednesday', 'Thursday','Friday','Saturday', 'Sunday']})
이 DataFrame을 출력한 결과는 다음 그림 1-17과 같다.
▲ 그림 1-17 원핫 인코딩에 사용할 예시 데이터