SimpleImputer 클래스의 add_indicator 매개변수를 True로 지정하면 indicator_ 속성이 추가되고 transform 메서드가 누락된 값의 위치가 포함된 배열을 반환합니다.
>>> imr = SimpleImputer(add_indicator=True)
>>> imputed_data = imr.fit_transform(df.values)
>>> imputed_data
array([[ 1. , 2. , 3. , 4. , 0. , 0. ],
[ 5. , 6. , 7.5, 8. , 1. , 0. ],
[10. , 11. , 12. , 6. , 0. , 1. ]])
추가된 indicator_ 속성은 MissingIndicator 클래스의 객체입니다. MissingIndicator 객체의 features_ 속성은 누락된 값이 있는 특성의 인덱스를 담고 있습니다.
>>> imr.indicator_.features_
array([2, 3])
MissingIndicator 객체의 fit_transform 메서드를 호출하면 features_ 속성에 담긴 특성에서 누락된 값의 위치를 나타내는 배열을 반환합니다. 여기에서는 세 번째, 네 번째 특성의 누락된 값의 위치입니다. 이 배열 값이 SimpleImputer 객체의 transform 메서드가 반환한 배열의 마지막 두 열에 해당합니다.