9 평가하기
분류 문제의 정답을 얼마나 맞혔는지를 의미하는 정확도(accuracy)로 평가해 보자. 만약 값이 0.79라면 전체 문제를 100개라고 봤을 때 79개를 맞혔다는 뜻이다.
정확도를 구하는 방법은 정답값과 예측값이 같은지를 비교해 그 값의 평균을 계산하면 된다. 즉, 정답값과 예측값이 같다면 True, 다르다면 False이며 이 값의 평균이 정답의 비율이다. 만약 모든 값을 다 맞혔다면 1, 다 틀렸다면 0이다.
from sklearn.model_selection import KFold from sklearn.model_selection import cross_val_score k_fold = KFold(n_splits=5, shuffle=True, random_state=42) scoring = 'accuracy' score = cross_val_score(model, train_feature_tfidf, y_label, cv=k_fold, n_jobs=-1, scoring=scoring) score
실행 결과
array([0.79329609, 0.80979021, 0.8041958 , 0.77762238, 0.78321678])