더북(TheBook)

ColumnTransformer에 사용한 변환기는 named_transformers_ 속성에서 앞서 지정한 ord_enc 이름으로 참조할 수 있습니다. 정수로 인코딩된 값을 다시 문자열로 변환하려면 다음과 같이 OrdinalEncoderinverse_transform 메서드를 호출합니다.

>>> col_trans.named_transformers_['ord_enc'].inverse_transform(X_trans)
array([['green'],
       ['red'],
       ['blue']], dtype=object)

OrdinalEncoder 클래스의 dtype 매개변수 기본값은 np.float64로 실수로 인코딩합니다. 앞에서는 정수로 인코딩하기 위해 int로 지정했습니다. categories 매개변수의 기본값은 'auto'로 훈련 데이터셋에서 자동으로 범주를 인식합니다. 또는 categories 매개변수에 직접 범주 리스트를 전달할 수 있습니다. 인식된 범주는 categories_ 속성에 저장됩니다.

사이킷런 0.24 버전에서는 OneHotEncoderhandle_unknownunknown_value 매개변수가 추가되었습니다. handle_unknown의 기본값은 'error'로 알 수 없는 범주 데이터가 transform 메서드로 전달될 때 에러가 발생됩니다. handle_unknown='use_encoded_value'로 설정하면 알 수 없는 범주를 unknown_value에 지정한 정수 값으로 설정합니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.