더북(TheBook)

나이대를 예측하는 인공지능 모델의 오차 구하기

두 번째 모델은 여럿 중 하나로 구분하는 인공지능입니다. 이러한 문제를 다중 분류 문제라고 합니다. 예를 들어 나이대를 예측하는 인공지능은 다음과 같이 예측했다고 봅시다.

20대 이하일 확률은 30%, 30~40대일 확률은 60%, 50대 이상일 확률은 10%와 같이 말이죠. 그러면 인공지능은 이 사람이 30~40대라고 말합니다. 가장 높은 확률로 예측하기 때문입니다.

그림 6-2 | 나이대를 예측하는 테스트

그런데 정답이 20대 이하라고 해 봅시다. 그러면 20대 이하일 확률이 30%라고 예측한 결과에 대한 오차는 0으로 계산합니다. 그리고 30~40대라고 예측한 결과는 60%인데, 50대 이상이라고 예측한 결과는 10%이므로 30~40대라고 예측한 결과에 더 큰 오차값을 줍니다.

예를 들어 20대 이하일 확률이 30%라고 예측하는 모습에서 0을, 30~40대를 60%라고 예측하는 모습에서 오차 300을, 50대 이상을 10%라고 예측하는 모습에서 오차 50을 주는 것이지요.


다중 분류 손실 함수

이와 같이 오차를 계산하는 방법에는 다중 분류 손실 함수(카테고리컬 크로스엔트로피, categorical crossentropy) 방법이 있습니다. 여러 값 중 하나를 예측하는 모델일 경우에 정답을 예측할 경우에는 오차를 0으로, 정답이 아닌 값을 높은 확률로 예측하면 오차를 많게, 낮은 확률로 정답이 아닌 확률을 예측하면 오차를 적게 하는 방법입니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.