더북(TheBook)

앞에서 간단히 언급했듯이 양성으로 예측하는 데 시그모이드 출력에 적용할 임계값이 정확히 0.5일 필요가 없습니다. 사실 상황에 따라서는 0.5보다 크거나(하지만 1보다는 작게) 0.5보다 작게(하지만 0보다는 크게) 지정하는 것이 나을 수 있습니다. 임계값을 낮추면 입력을 양성으로 예측하는 데 더 자유스러워 재현율이 높아지지만 정밀도는 낮아집니다. 반대로 임계값을 높이면 모델이 입력을 양성으로 예측하는 데 더 주의를 기울이므로 정밀도가 높아지지만 재현율은 낮아집니다. 따라서 정밀도와 재현율 사이에 균형점이 있습니다. 이 균형은 지금까지 이야기한 지표 중 하나로 정량화하기 어렵습니다. 다행히 이진 분류에 관한 오랜 연구 덕분에 이 균형 관계를 정량화하고 시각화할 수 있는 방법이 개발되었습니다. 다음에 이야기할 ROC 곡선이 이런 종류의 도구로 자주 사용됩니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.