더북(TheBook)

6.5.1 오차 행렬

여러 가지 지표를 자세히 알아보기 전에 학습 알고리즘의 성능을 행렬로 펼쳐 놓은 오차 행렬(confusion matrix)14을 살펴보겠습니다. 오차 행렬은 그림 6-9와 같이 진짜 양성(True Positive, TP), 진짜 음성(True Negative, TN), 거짓 양성(False Positive, FP), 거짓 음성(False Negative, FN)의 개수를 적은 단순한 정방 행렬입니다.

▲ 그림 6-9 오차 행렬

이 행렬은 타깃 클래스와 예측 클래스의 레이블을 직접 세어 계산할 수 있지만 사이킷런에서 제공하는 편리한 confusion_matrix 함수를 사용할 수 있습니다.

>>> from sklearn.metrics import confusion_matrix

>>> pipe_svc.fit(X_train, y_train)
>>> y_pred = pipe_svc.predict(X_test)
>>> confmat = confusion_matrix(y_true=y_test, y_pred=y_pred)
>>> print(confmat)
 [[71 1]
  [ 2 40]]

 

 


14 역주 confusion matrix를 ‘혼동 행렬’이라고 번역하는 경우가 많지만 처음 접하는 경우에는 어떤 의미인지 파악하기 어렵습니다. 책에서는 좀 더 쉽게 이해할 수 있도록 ‘오차 행렬’이라고 옮겼습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.