더북(TheBook)

28 역주 KNeighborsClassifier 클래스의 metric 매개변수의 기본값이 'minkowski'이고 p의 기본값은 2입니다. algorithm 매개변수의 기본값은 'auto'minkowski 거리를 사용하면 k-d 트리 알고리즘이 됩니다. knn 객체의 _fit_method 속성에서 사용된 알고리즘을 확인할 수 있습니다.

 

29 역주 길이가 1인 2차원 정사각형에 0.1 간격마다 샘플을 놓으려면 10×10개가 필요합니다. 10차원 입방체에는 10100개의 샘플이 필요합니다. 샘플 개수가 고정되어 있을 때 특성이 늘어나면 특성 공간은 급격하게 희소해집니다.

 

30 역주 여기에서는 L1/L2 규제를 말합니다. 일반적으로 결정 트리를 가지치기하고 KNN의 이웃 개수를 늘리면 규제 효과를 볼 수 있습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.