7.3 K-최근접 이웃 알고리즘을 이용한 회귀
K-최근접 이웃 알고리즘은 주로 분류나 회귀에 많이 사용한다. 즉, 예측에 이용된다.
예를 들어 K-최근접 이웃 알고리즘을 이용해 기말시험 결과를 예측해보자. 친구들과 같은 책을 이용해 같은 시간 동안 공부했을 경우, 친구들이 대부분 A 학점을 받았다면 나도 같은 학점을 받을 것으로 기대할 수 있다. 이것이 K-최근접 이웃 알고리즘을 이용한 분류다.
그런데 학점이 아닌 점수라면? 친구들이 평균적으로 91점을 받았다면 나의 점수도 비슷한 수준이라고 기대하는 것이 K-최근접 이웃 알고리즘을 이용한 회귀다.
이 절에서는 K-최근접 이웃 알고리즘을 이용해 S&P500지수가 다음 매매일에 상승할 것인지, 또는 하락할 것인지를 예측해볼 것이다. 따라서 내일의 주가지수가 오늘보다 높다면 주식을 사고, 반대로 오늘보다 낮다면 주식을 파는 전략을 사용할 것이다.
앞서 박쥐를 분류하는 예에서는 알고리즘에 대한 이해를 높이고자 직접 만든 코드를 사용했지만, 이번에는 파이썬으로 구현된 머신 러닝 오픈 소스 라이브러리인 Scikit-learn을 사용한다. 그리고 K-최근접 이웃 알고리즘을 구현한 KNeighborsClassifier를 사용할 것이다.