정밀도(precision)와 재현율(recall)은 정확도가 놓친 것을 감지할 수 있습니다. 이어지는 설명에서 추가적인 작업이 필요한 양성 샘플을 가진 문제에 대해 생각하겠습니다. 예를 들면 링크를 강조하거나 수동으로 리뷰하기 위해 글에 표시를 하는 것 등입니다. 반면에 음성 샘플은 현재 상태와 비슷합니다. 이 지표들은 예측이 저지를 수 있는 여러 종류의 잘못에 초점을 맞춥니다.
정밀도는 실제 양성 샘플 중에서 모델이 만든 양성 예측의 비율입니다.
정밀도 = #TP / (#TP + #FP)
앞선 오차 행렬의 수치를 사용해 계산하면 다음과 같습니다.
정밀도 = 4 / (4 + 1) = 80%
정확도와 마찬가지로 정밀도는 왜곡될 수 있습니다. 매우 높은 시그모이드 출력(예를 들어 0.5 대신 0.95보다 큰 경우)을 가진 샘플만 양성으로 예측하여 모델을 매우 보수적으로 만들 수 있습니다. 이렇게 하면 보통 정밀도가 높아지지만 모델이 진짜 양성 샘플을 많이 놓치게 됩니다(놓친 샘플을 음성으로 예측합니다). 이런 문제점은 정밀도와 함께 사용되어 이를 보완하는 지표인 재현율에 의해 감지됩니다.
재현율은 모델이 양성으로 분류한 샘플 중에 진짜 양성 샘플의 비율입니다.
재현율 = #TP / (#TP + #FN)
앞의 오차 행렬로 계산하면 다음과 같습니다.
재현율 = 4 / (4 + 2) = 66.7%