더북(TheBook)

앞의 코드 예에서 첫 번째 열만 변환하기 위해 지정했고 나머지 두 열은 변경하지 않고 그대로 두기 위해 'passthrough'로 지정했습니다.

원-핫 인코딩으로 더미 변수를 만드는 더 편리한 방법은 판다스의 get_dummies 메서드를 사용하는 것입니다. DataFrame에 적용하면 get_dummies 메서드는 문자열 열만 변환하고 나머지 열은 그대로 둡니다.

>>> pd.get_dummies(df[['price', 'color', 'size']])
   price  size  color_blue  color_green  color_red
0   10.1     1           0            1          0
1   13.5     2           0            0          1
2   15.3     3           1            0          0

Note ≡


역주 get_dummies 메서드에서 columns 매개변수를 사용하면 다음과 같이 변환하려는 특성을 구체적으로 지정할 수 있습니다.

>>> pd.get_dummies(df[['price', 'color', 'size']], columns=['size'])
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.