예를 들어 다음 그림과 같이 새로운 입력 데이터(빨간색 외각선 원)가 세 개 있을 때 새로운 입력에 대한 분류를 진행해 보겠습니다(K=3).
• 새로운 입력 ➊: 주변 범주 세 개가 주황색이므로 주황색으로 분류
• 새로운 입력 ➋: 주변 범주 두 개가 주황색, 한 개가 녹색이므로 주황색으로 분류
• 새로운 입력 ➌: 주변 범주 두 개가 녹색, 한 개가 주황색이므로 녹색으로 분류
▲ 그림 3-3 K-최근접 이웃 학습 절차
이제 코드에서 구체적으로 확인해 보겠습니다. 예제 목표는 붓꽃에 대한 분류입니다. 참고로 머신 러닝 코드는 심층 신경망이 필요하지 않기 때문에 사이킷런(scikit-learn)을 이용합니다.
다음 과정으로 K 값을 예측할 것입니다.
▲ 그림 3-4 K-최근접 이웃 예제