다음은 모델 훈련에 대한 실행 결과입니다.
DecisionTreeClassifier()
모델을 이용하여 검증 데이터에 대한 예측을 진행합니다.
코드 3-14 모델 예측
y_predict = model.predict(X_test)
from sklearn.metrics import accuracy_score
accuracy_score(y_test, y_predict) ------ 검증 데이터에 대한 예측 결과를 보여 줍니다.
다음은 모델 예측에 대한 출력 결과입니다.
0.8379888268156425
결과가 83%로 높은 수치를 보이고 있습니다. 즉, 학습이 잘되었습니다.
이번에는 혼동 행렬을 이용한 결과를 살펴보겠습니다.
코드 3-15 혼동 행렬을 이용한 성능 측정
from sklearn.metrics import confusion_matrix
pd.DataFrame(
confusion_matrix(y_test, y_predict),
columns=['Predicted Not Survival', 'Predicted Survival'],
index=['True Not Survival', 'True Survival']
)