더북(TheBook)

과적합을 피하기 위해 일반적으로 사용하는 방법인 조기 종료와 드롭아웃(dropout) 등을 사용했고 값을 변동해 봤으나 큰 차이는 없었다. 즉, 특정 범주에 데이터 불균형이 있었고 그에 따라 명확하게 구분되지 않았다고 할 수 있다. 6장에서 다룬 KLUE의 연합뉴스 타이틀 분류의 경우는 3명 이상의 사람이 분류했을 때 2명 이상이 동일하게 같은 범주라고 한 데이터만 가지고 벤치마크 세트를 만든 것이다. 이와 같이 데이터 분류에서 사람의 평가를 거칠 수 없다면 복지 부분의 데이터를 늘리거나 모델을 변경해 보는 것을 고려할 수 있다.

다음으로 손실(loss)값도 확인해 보자. 여기서 손실은 모델이 예측한 값과 실제 정답 사이의 차이에서 발생하는 손실을 의미한다. 결과 그래프를 보면 아래에 위치한 loss가 꾸준히 하강하다가 다시 살짝 증가한 시점에서 모델이 추정 오차가 최대가 되었다고 판단하고 학습을 종료했음을 알 수 있다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.