다음 그림은 혼동 행렬에 대한 출력 결과입니다.
▲ 그림 3-16 결정 트리 코드 실행 결과
결과가 제대로 나왔는지 확인하려면 혼동 행렬의 개념을 이해해야 합니다.
혼동 행렬은 알고리즘 성능 평가에 사용됩니다. 혼동 행렬에서 사용되는 다음 표를 먼저 살펴보겠습니다.
▼ 표 3-5 혼동 행렬
예측 값 |
|||
Positive |
Negative |
||
실제 값 |
Positive |
TP |
FN |
Negative |
FP |
TN |
혼동 행렬에서 사용하는 용어는 2장에서 다루었지만 리마인드 차원에서 다시 정리하면 다음과 같습니다.
• True Positive: 모델(분류기)이 ‘1’이라고 예측했는데 실제 값도 ‘1’인 경우
• True Negative: 모델(분류기)이 ‘0’이라고 예측했는데 실제 값도 ‘0’인 경우
• False Positive: 모델(분류기)이 ‘1’이라고 예측했는데 실제 값은 ‘0’인 경우
• False Negative: 모델(분류기)이 ‘0’이라고 예측했는데 실제 값은 ‘1’인 경우