더북(TheBook)

코드 15-1의 knnplane 프로그램 실행 결과를 그림 15-5에 나타냈습니다. 그림 15-5는 knnplane 프로그램을 실행하여 트랙바의 k 값을 각각 1, 3, 5로 지정했을 때의 분류 결과입니다. 그림 15-5(a)는 k가 1인 경우의 분류 결과이고, 그림 15-5(b)는 k가 3인 경우이며, 그림 15-5(c)는 k가 5인 경우입니다. k 값이 1인 경우에는 붉은색 영역에 가깝게 위치한 녹색 점과 녹색 영역에 가깝게 위치한 파란 점 때문에 클래스 경계면이 유난히 볼록하게 튀어나온 부분이 발생하였습니다. 반면에 k 값을 3 또는 5로 바꾸면 클래스 경계면이 다소 완만한 형태로 바뀌게 됩니다. 이는 k 값이 증가함에 따라 잡음 또는 이상치에 해당하는 훈련 데이터 영향이 줄어드는 것으로 생각할 수 있습니다.

▲ 그림 15-5 kNN 알고리즘을 이용한 2차원 점 분류

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.