■ 나이대를 예측하는 인공지능 모델의 오차 구하기
두 번째 모델은 여럿 중 하나로 구분하는 인공지능입니다. 이러한 문제를 다중 분류 문제라고 합니다. 예를 들어 나이대를 예측하는 인공지능은 다음과 같이 예측했다고 봅시다.
20대 이하일 확률은 30%, 30~40대일 확률은 60%, 50대 이상일 확률은 10%와 같이 말이죠. 그러면 인공지능은 이 사람이 30~40대라고 말합니다. 가장 높은 확률로 예측하기 때문입니다.
그림 6-2 | 나이대를 예측하는 테스트
그런데 정답이 20대 이하라고 해 봅시다. 그러면 20대 이하일 확률이 30%라고 예측한 결과에 대한 오차는 0으로 계산합니다. 그리고 30~40대라고 예측한 결과는 60%인데, 50대 이상이라고 예측한 결과는 10%이므로 30~40대라고 예측한 결과에 더 큰 오차값을 줍니다.
예를 들어 20대 이하일 확률이 30%라고 예측하는 모습에서 0을, 30~40대를 60%라고 예측하는 모습에서 오차 300을, 50대 이상을 10%라고 예측하는 모습에서 오차 50을 주는 것이지요.
잠깐만요
다중 분류 손실 함수
이와 같이 오차를 계산하는 방법에는 다중 분류 손실 함수(카테고리컬 크로스엔트로피, categorical crossentropy) 방법이 있습니다. 여러 값 중 하나를 예측하는 모델일 경우에 정답을 예측할 경우에는 오차를 0으로, 정답이 아닌 값을 높은 확률로 예측하면 오차를 많게, 낮은 확률로 정답이 아닌 확률을 예측하면 오차를 적게 하는 방법입니다.