더북(TheBook)

3.5.2 k-최근접 이웃에서의 k

선택은 우리 삶을 항상 복잡하게 만듭니다. 우리 동네가 어떤지 알아보려면 먼저 이웃 사람들의 서로 다른 의견을 종합하는 방법을 결정해야 합니다. 이 문제를 누가 투표를 할지 그리고 어떻게 투표를 종합할지 결정하는 문제로 생각할 수 있습니다.

가장 가까운 이웃 대신, 가까운 이웃 여럿을 고려하는 방법을 쓸 수 있습니다. 개념적으로 이웃 범위를 늘리면 더 넓은 시각을 얻을 수 있지요. 기술적인 관점에서 확장된 이웃은 데이터에 있는 노이즈로부터 우리를 보호해 줍니다. 이것은 나중에 더 자세히 알아보겠습니다. 자주 사용하는 이웃의 수는 1, 3, 10 혹은 20입니다. 이 기법을 ‘k-최근접 이웃’이라고 하며, 이 책에서는 ‘k-NN’이라는 약어로 칭하겠습니다. k-NN을 분류 용도로 사용할 때는 끝에 C를 붙여서 k-NN-C라고 하겠습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.