6.6 요약
이 장 서두에서 머신 러닝 모델을 효율적으로 훈련하고 평가하기 위해 여러 개의 변환기와 분류기를 모델 파이프라인으로 연결하는 방법을 설명했습니다. 이런 파이프라인을 사용하여 모델 선택과 평가를 위한 핵심 기법 중 하나인 k-겹 교차 검증을 수행했습니다. k-겹 교차 검증으로 학습 곡선과 검증 곡선을 그려서 과대적합과 과소적합 같은 머신 러닝 모델에서 흔히 나타나는 문제를 분석했습니다.
모델을 세부 튜닝하기 위해 그리드 서치를 사용했습니다. 그다음 오차 행렬과 다양한 성능 지표를 사용하여 해당 문제에 맞는 모델의 성능을 평가하고 최적화했습니다. 마지막으로 많은 실전 애플리케이션에서 흔히 발생하는 불균형한 데이터를 다루기 위한 여러 방법을 설명하면서 이 장을 마쳤습니다. 이제 성공적인 분류 작업을 위한 지도 학습 알고리즘 모델을 구축하는 데 필요한 모든 기술을 배웠습니다.
다음 장에서 앙상블 방법을 살펴보겠습니다. 이 방법은 여러 개의 모델과 분류 알고리즘을 연결하여 머신 러닝 시스템의 예측 성능을 더욱 끌어올릴 수 있습니다.