더북(TheBook)

SimpleImputer 클래스의 add_indicator 매개변수를 True로 지정하면 indicator_ 속성이 추가되고 transform 메서드가 누락된 값의 위치가 포함된 배열을 반환합니다.

>>> imr = SimpleImputer(add_indicator=True)
>>> imputed_data = imr.fit_transform(df.values)
>>> imputed_data
array([[ 1. ,  2. ,  3. ,  4. ,  0. ,  0. ],
       [ 5. ,  6. ,  7.5,  8. ,  1. ,  0. ],
       [10. , 11. , 12. ,  6. ,  0. ,  1. ]])

추가된 indicator_ 속성은 MissingIndicator 클래스의 객체입니다. MissingIndicator 객체의 features_ 속성은 누락된 값이 있는 특성의 인덱스를 담고 있습니다.

>>> imr.indicator_.features_
array([2, 3])

MissingIndicator 객체의 fit_transform 메서드를 호출하면 features_ 속성에 담긴 특성에서 누락된 값의 위치를 나타내는 배열을 반환합니다. 여기에서는 세 번째, 네 번째 특성의 누락된 값의 위치입니다. 이 배열 값이 SimpleImputer 객체의 transform 메서드가 반환한 배열의 마지막 두 열에 해당합니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.