5.1 주성분 분석을 통한 비지도 차원 축소
특성 선택과 마찬가지로 여러 가지 특성 추출 기법을 사용하여 데이터셋의 특성 개수를 줄일 수 있습니다. 특성 선택과 특성 추출의 차이는 원본 특성을 유지하느냐에 있습니다. 순차 후진 선택 (sequential backward selection) 같은 특성 선택 알고리즘을 사용할 때는 원본 특성을 유지하지만 특성 추출은 새로운 특성 공간으로 데이터를 변환하거나 투영합니다.
차원 축소 관점에서 보면 특성 추출은 대부분의 관련 있는 정보를 유지하면서 데이터를 압축하는 방법으로 이해할 수 있습니다. 특성 추출이 저장 공간을 절약하거나 학습 알고리즘의 계산 효율성을 향상할 뿐만 아니라 차원의 저주(curse of dimensionality) 문제를 감소시켜 예측 성능을 향상하기도 합니다. 특히 규제가 없는 모델로 작업할 때 그렇습니다.