더북(TheBook)

그림 5- 8은 이진 분류 문제를 위한 LDA 개념을 요약하여 나타냅니다. 클래스 1의 샘플은 동그라미고 클래스 2의 샘플은 덧셈 기호입니다.

▲ 그림 그림 5- 8 이진 분류를 위한 LDA의 개념

x축(LD 1)으로 투영하는 선형 판별 벡터는 두 개의 정규 분포 클래스를 잘 구분합니다. y축(LD 2)으로 투영하는 선형 판별 벡터는 데이터셋에 있는 분산을 많이 잡아내지만 클래스 판별 정보가 없기 때문에 좋은 선형 판별 벡터가 되지 못합니다.

LDA는 데이터가 정규 분포라고 가정합니다. 또한, 클래스가 동일한 공분산 행렬을 가지고 훈련 샘플은 서로 통계적으로 독립적이라고 가정합니다. 하나 이상의 가정이 (조금) 위반되더라도 여전히 LDA는 차원 축소를 상당히 잘 수행합니다.11

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.