step 매개변수에서 각 반복에서 제거할 특성의 개수를 지정합니다. (0, 1) 사이의 값을 지정하면 삭제할 특성의 비율이 됩니다. 기본값은 1입니다.
기본적으로 기반 모델의 coef_나 feature_importances_ 속성을 기준으로 특성을 제거합니다. 사이킷런 0.24 버전에서 사용할 속성을 지정할 수 있는 importance_getter 매개변수가 추가되었습니다.
SelectFromModel과 비교하기 위해 다섯 개의 특성을 골라 보겠습니다.
>>> from sklearn.feature_selection import RFE
>>> rfe = RFE(forest, n_features_to_select=5)
>>> rfe.fit(X_train, y_train)
ranking_ 속성에는 선택한 특성의 우선순위가 들어 있습니다. 1은 기반 모델이 선택한 다섯 개의 특성입니다.
>>> rfe.ranking_
array([1, 5, 9, 6, 4, 3, 1, 8, 7, 1, 2, 1, 1])
선택된 특성은 support_ 속성에 True로 표시됩니다. 이 값을 f_mask로 저장하여 특성의 이름을 표시하는 데 사용하겠습니다.
>>> f_mask = rfe.support_