더북(TheBook)

3.5.3 답 조합

이제 마지막으로 살펴볼 것이 하나 남았습니다. 근처에 있는 혹은 비슷한 이웃에게서 받은 알려진 값(투표)을 어떻게 조합할지 결정해야 합니다. 동물을 분류하는 문제에서 가장 가까운 이웃들이 고양이, 고양이, 개, 얼룩말이라고 투표했다고 가정합시다. 이 시험 사례에 대해 어떻게 반응해야 할까요? 가장 많은 득표를 한 고양이를 채택하는 것이 좋은 방법인 듯하네요.

수치형 값을 예측하는 회귀 문제에서도 똑같은 이웃-기반 기법을 사용할 수 있습니다. 달라지는 것은 이웃의 타깃을 종합하는 방법뿐입니다. 가장 가까운 이웃 3명이 3.1, 2.2, 7.1이라는 수치형 값을 주었을 때 이 값들을 어떻게 종합해야 할까요? 원하는 어떤 방법이든 사용할 수 있지만, 평균(mean)이나 중앙값(median)이 가장 흔하고 유용하게 사용할 수 있는 선택지입니다. 회귀 문제에서 사용하는 k-NN은 다음 장에서 다시 알아봅시다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.