더북(TheBook)
>>> imr.indicator_.fit_transform(df.values)
array([[False, False],
       [ True, False],
       [False,  True]])

사이킷런 0.24 버전에서는 SimpleImputer 클래스에 원본 특성으로 변환하는 inverse_transform 메서드가 추가되었습니다.

>>> imr.inverse_transform(imputed_data)
array([[ 1.,  2.,  3.,  4.],
       [ 5.,  6., nan,  8.],
       [10., 11., 12., nan]])

SimpleImputer는 한 특성의 통계 값을 사용하여 누락된 값을 채웁니다. 이와 달리 IterativeImputer 클래스는 다른 특성을 사용하여 누락된 값을 예측합니다. 먼저 initial_strategy 매개변수에 지정된 방식으로 누락된 값을 초기화합니다. 그다음 누락된 값이 있는 한 특성을 타깃으로 삼고 다른 특성을 사용해서 모델을 훈련하여 예측합니다. 이런 식으로 누락된 값이 있는 모든 특성을 순회합니다.

initial_strategy 매개변수에 지정할 수 있는 값은 SimpleImputer와 동일하게 'mean', 'median', 'most_frequent', 'constant'가 가능합니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.