7.2.2 분류 모델 평가하기
훈련이 끝나면 모델의 성능을 평가해야 합니다. 평가를 위해서 다음과 같은 과정이 필요합니다.
1. 라벨이 있는 데이터셋을 훈련 데이터셋과 테스트 데이터셋으로 나눕니다. 테스트 데이터셋으로 훈련된 모델의 성능을 측정합니다.
2. 테스트 데이터셋의 특성을 이용해 각 행의 라벨을 생성합니다. 이것이 우리가 예측한 라벨입니다.
3. 예측 라벨을 실제 라벨과 비교하여 모델의 성능을 평가합니다.
주의 ≡
아주 간단한 문제를 푸는 것이 아니라면 모델을 평가할 때 어느 정도 오분류가 발생하기 마련입니다. 모델의 성능을 결정하는 오분류를 해석하는 것은 우리가 어떤 성능 척도를 선택하느냐에 달렸습니다.
실제 라벨과 예측 라벨이 준비되면, 이를 이용해 여러 성능 척도를 계산하여 모델을 평가할 수 있습니다. 성능 평가에 사용할 최적의 지표는 비즈니스 문제의 요구사항과 훈련 데이터셋의 특성에 따라 달라집니다.