더북(TheBook)

정확도(accuracy)는 정확히 예측한 Positive와 Negative(즉, True Positive와 True Negative)의 비율을 의미한다. 그러나 실제 데이터에 Negative 비율이 너무 높아서 희박한 가능성으로 발생할 상황을 제대로 분류하지 못하는 경우가 생길 수 있다. 가령 여름인데, 눈이 내릴지 여부를 예측한다면 100% 가까운 정확도가 나올 것이다(True Nagative가 나올 것이다). 이를 정확도의 역설이라고 한다.

재현율(recall)은 실제로 정답이 True인 것들 중에서 분류기가 True로 예측한 비율이다. True가 발생하는 확률이 적을 때 사용하면 좋다.

정밀도(precision)는 비가 올 것이라고 예측한 날 중에서 실제로 비가 내린 날의 비율을 구한다.

재현율과 정밀도는 서로 반대 개념의 지표이며, 정밀도의 단점은 재현율의 장점이기도 하다.

F1 스코어(F1 score)는 재현율과 정밀도의 조화평균이다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.