신경망 교과서: 3.8.2 회귀 손실 함수

3.8.2 회귀 손실 함수

먼저 회귀가 무엇인지, 회귀 문제를 다루는 신경망 아키텍처는 어떻게 다른지 이해해 보자. 이번에 만들 모델은 택시 요금을 예측하며, 이 목표 변수는 연속(continuous) 변수다. 2장에서 환자의 당뇨 위험을 이진 변수(즉, 1 또는 0)로 예측한 것과 상당히 다르다. 다시 말해 회귀 모델은 연속 변수(예: 비용, 시간, 높이 등) 값을 예측하며, 분류 모델은 클래스(예: 당뇨 발병, 미발병 등)를 예측한다.

2장에서는 예측이 얼마나 잘 맞는지 측정하는 지표로 백분율 정확도를 사용했다. 회귀 문제에서는 주로 RMSE(Root Mean Squared Error)를 오차 지표로 사용한다. RMSE 계산 공식은 다음과 같다.

공식에서 예측값과 실제값의 차이(즉, 오차)를 제곱하는 이유는 실제값보다 예측값이 큰 경우와 작은 경우에 동일한 페널티를 부과하기 위해서다. 또한, 제곱근을 적용하는 것은 실제값과 오차를 유사한 스케일로 만들기 위해서다. 이 RMSE를 신경망의 손실 함수로 사용해 훈련시키면 예측 오차를 줄이는 방향으로 가중치를 조절할 수 있다.

신간 소식 구독하기

뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.