더북(TheBook)

두 번째 사례는 무죄 추정의 원칙을 가진 미국의 법률 시스템입니다. 1명의 무고한 시민을 감옥에 가두는 것보다 99명의 범죄자를 놓치는 것이 낫다는 원칙이죠. 앞서 질병 사례에서는 희귀성 이슈를 다루었습니다. 범죄와 범죄자도 마찬가지로 흔하지 않습니다. 또 예측 실패의 비용도 다릅니다. 범죄자를 더 잡는 것보다 무고한 시민에게 제대로 된 판단을 내리는 것의 가치가 더 높다고 판단합니다. 적어도 고등학교 윤리 시간에 배우는 이상적인 세계는 그러하죠. 법률과 의학 분야의 두 사례는 모두 불균형한 타깃 클래스를 다룹니다. 질병과 유죄는 50:50으로 발생하지 않죠. 불균형한 타깃을 평가하는 방법은 6.2절에서 자세히 설명하겠습니다.

정확도 측정에 대해 마지막으로 한마디만 추가하겠습니다. 오차가 서로 상쇄된다고 해서 정답이 되지는 않습니다. 예를 들어 강수량을 예측한다고 할 때 한 번은 정답보다 2인치 더 적게 예측했고, 다른 한 번은 2인치 더 많게 예측했다고 합시다. 두 오차의 평균은 0이니 정확한 예측을 했다고 볼 수 있을까요? 항상 그렇지는 않습니다. 평균 같은 요약 통계량은 오차가 가진 특징을 가립니다. 이 예측 모델을 이용해서 밭에 뿌릴 물의 양을 결정한다면 물을 너무 많이 주어서 작물이 썩어 버리거나 너무 적게 뿌려 뿌리가 말라 버릴 수도 있습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.