코드를 실행하면 다음과 같은 예측 결과가 출력됩니다.
0.9511111111111111
성능 측정 결과는 95%로 나쁘지 않습니다. 결과를 좀 더 명확하게 확인하고자 혼동 행렬로 표현해 보겠습니다.
혼동 행렬은 지도 학습에서 테스트 데이터셋에 대한 분류 모델 성능을 설명하는 데 자주 사용됩니다. 혼동 행렬을 표현하기 위해 파이썬 패키지 Seaborn을 사용합니다.
코드 3-21 혼동 행렬 시각화
import numpy as np
import seaborn as sns
from sklearn import metrics
cm = metrics.confusion_matrix(y_test, predictions) ------ 혼동 행렬(confusion_matrix)
plt.figure(figsize=(9,9))
sns.heatmap(cm, annot=True, fmt=".3f", linewidths=.5, square=True, cmap='Blues_r'); ------ heatmap으로 표현
plt.ylabel('Actual label'); ------ y축
plt.xlabel('Predicted label'); ------ x축
all_sample_title = 'Accuracy Score: {0}'.format(score)
plt.title(all_sample_title, size=15);
plt.show();