그림 5-6은 이진 분류 문제를 위한 LDA 개념을 요약하여 나타냅니다. 클래스 1의 샘플은 동그라미이고 클래스 2의 샘플은 덧셈 기호입니다.
▲ 그림 5- 6 선형 판별 분석
x축(LD 1)으로 투영하는 선형 판별 벡터는 두 개의 정규 분포 클래스를 잘 구분합니다. y축(LD 2)으로 투영하는 선형 판별 벡터는 데이터셋에 있는 분산을 많이 잡아내지만 클래스 판별 정보가 없기 때문에 좋은 선형 판별 벡터가 되지 못합니다.
LDA는 데이터가 정규 분포라고 가정합니다. 또 클래스가 동일한 공분산 행렬을 가지고 훈련 샘플은 서로 통계적으로 독립적이라고 가정합니다. 하나 이상의 가정이 (조금) 위반되더라도 여전히 LDA는 차원 축소를 상당히 잘 수행합니다.11
11 Pattern Classification 2nd Edition, R. O. Duda, P. E. Hart, and D. G. Stork, New York, 2001