더북(TheBook)

ROC 곡선의 수직축은 진짜 양성 비율(True Positive Rate, TPR)로 다음과 같이 정의됩니다.

TPR = #TP / (#TP + #FN) = 재현율

TPR은 재현율의 정의와 동일하며 이름이 다를 뿐입니다. 하지만 FPR은 새로운 지표입니다. 실제 클래스가 음성인 모든 샘플의 개수가 분모가 되고, 거짓 양성의 개수가 분자입니다. 다른 말로 하면, FPR은 양성으로 잘못 분류된 실제 음성 샘플의 비율입니다. 즉, 잘못된 경보를 일으킬 확률입니다. 표 3-4는 이진 분류 문제에서 자주 사용하는 측정 지표를 요약합니다.

▼ 표 3-4 이진 분류 문제에 자주 사용하는 측정 지표

측정 지표

정의

ROC 곡선이나 정밀도/재현율 곡선에 사용되는 방법

정확도

(#TP + #TN) / (#TP + #TN + #FP + #FN)

ROC에 사용되지 않음

정밀도

#TP / (#TP + #FP)

정밀도/재현율 곡선의 수직축

재현율/민감도/진짜 양성 비율(TPR)

#TP / (#TP + #FN)

ROC 곡선의 수직축(그림 3-6 참조)이나 정밀도/재현율 곡선의 수평축

거짓 양성 비율(FPR)

#FP / (#FP + #TN)

ROC 곡선의 수평축(그림 3-6 참조)

AUC

ROC 곡선을 적분하여 계산됩니다. 코드 3-7의 예를 참고하세요.

ROC 곡선에 사용되지 않지만 ROC 곡선을 사용해 계산됨

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.