더북(TheBook)

Note ≡ 사이킷런의 특성 선택 알고리즘


이전에 구현한 간단한 SBS에 관련된 여러 가지 순차 특성 선택 구현이 파이썬 패키지 mlxtend에 구현되어 있습니다(http://rasbt.github.io/mlxtend/user_guide/feature_selection/SequentialFeatureSelector/). mlxtend에는 많은 기능이 포함되어 있지만, 사이킷런 팀과 협력하여 최근 v0.24 버전에 사용하기 쉽고 간소화된 버전을 추가했습니다. 사용법과 동작은 이 장에서 구현한 SBS 코드와 매우 유사합니다. 자세한 내용은 온라인 문서(https://scikit-learn.org/stable/modules/generated/sklearn.feature_selection.SequentialFeatureSelector.html)를 참고하세요.

사이킷런에는 특성 선택 알고리즘이 많이 준비되어 있습니다. 특성 가중치에 기반을 둔 재귀적 특성 제거(recursive feature elimination), 특성 중요도를 사용한 트리 기반 방법, 일변량 통계 테스트(univariate statistical test)가 있습니다. 전체 특성 선택 방법에 대한 설명은 책 범위를 넘어섭니다. 사이킷런의 온라인 문서(http://scikit-learn.org/stable/modules/feature_selection.html)에서 좋은 예제와 설명을 참고하세요.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.