6.3 차원 축소 알고리즘 이해하기
데이터의 각 특성은 문제 공간의 각 차원에 대응됩니다. 특성의 개수를 최소화하면 문제를 단순하게 만드는 효과가 있습니다. 이를 차원 축소(dimensionality reduction)라고 합니다. 차원 축소는 다음과 같은 두 가지 방식으로 실행합니다.
• 특성 선별(feature selection): 우리가 풀려는 문제의 맥락에 맞는 중요한 특성들만 선택합니다.
• 특성 조합(feature aggregation): 다음 알고리즘 중 하나를 이용해 둘 이상의 특성을 조합하여 차원을 축소합니다.
– 주성분 분석(PCA): 선형 비지도 학습 알고리즘
– 선형 판별 분석(Linear Discriminant Analysis, LDA): 선형 지도 학습 알고리즘
– 커널 주성분 분석(kernel PCA): 비선형 알고리즘
이 중에서 가장 인기 있는 차원 축소 알고리즘인 PCA를 더 자세히 살펴보겠습니다.