더북(TheBook)

9 평가하기

 

분류 문제의 정답을 얼마나 맞혔는지를 의미하는 정확도(accuracy)로 평가해 보자. 만약 값이 0.79라면 전체 문제를 100개라고 봤을 때 79개를 맞혔다는 뜻이다.

정확도를 구하는 방법은 정답값과 예측값이 같은지를 비교해 그 값의 평균을 계산하면 된다. 즉, 정답값과 예측값이 같다면 True, 다르다면 False이며 이 값의 평균이 정답의 비율이다. 만약 모든 값을 다 맞혔다면 1, 다 틀렸다면 0이다.

from sklearn.model_selection import KFold
from sklearn.model_selection import cross_val_score
 
k_fold = KFold(n_splits=5, shuffle=True, random_state=42)
 
scoring = 'accuracy'
score = cross_val_score(model, train_feature_tfidf, 
                        y_label, cv=k_fold, n_jobs=-1, 
                        scoring=scoring)
score

실행 결과

array([0.79329609, 0.80979021, 0.8041958 , 0.77762238, 0.78321678])
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.