더북(TheBook)

KNN 알고리즘은 매우 간단해서 다음 단계로 요약할 수 있습니다.

1. 숫자 k와 거리 측정 기준을 선택합니다.

2. 분류하려는 샘플에서 k개의 최근접 이웃을 찾습니다.

3. 다수결 투표를 통해 클래스 레이블을 할당합니다.

그림 3-25는 새로운 데이터 포인트(물음표로 표시된 포인트)가 어떻게 이웃 다섯 개의 다수결 투표를 기반으로 삼각형 클래스 레이블에 할당되는지 보여 줍니다.

▲ 그림 3-25 k-최근접 이웃의 작동 방식

선택한 거리 측정 기준에 따라서 KNN 알고리즘이 훈련 데이터셋에서 분류하려는 포인트와 가장 가까운 (가장 비슷한) 샘플 k개를 찾습니다. 새로운 데이터 포인트의 클래스 레이블은 이 k개의 최근접 이웃에서 다수결 투표를 하여 결정됩니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.