앞에서 진행했던 코드(코드 3-37)보다 군집이 잘 표현되었습니다. 추가적으로 밀도 기반 군집 분석 모델의 하이퍼파라미터 인자 min_samples를 50에서 100으로 변경해 보면 그림 3-47과 같은 그래프를 출력합니다.
코드 3-39 min_samples를 50에서 100으로 변경
db = DBSCAN(eps=0.0375, min_samples=100).fit(X_principal)
코드를 실행하면 다음 그림과 같이 출력됩니다.
▲ 그림 3-47 밀도 기반 군집 분석과 PCA 예제에서 잘못된 하이퍼파라미터를 적용할 때의 결과
많은 클러스터 부분이 무시된 것을 확인할 수 있습니다. 이와 같이 모델에서 하이퍼파라미터 영향에 따라 클러스터 결과(성능)가 달라지므로, 최적의 성능을 내려면 하이퍼파라미터를 이용한 튜닝이 중요합니다.
모델 튜닝은 8장에서 자세히 다룰 예정이므로 이 장에서는 다루지 않습니다. 성능 최적화에서는 하드웨어 및 하이퍼파라미터를 이용한 최적화 방법에 대해 설명합니다.