더북(TheBook)

icon_chap 관련 용어를 정리해요!

Ratio of training to test data: 훈련 데이터와 검증 데이터를 나누는 비율을 의미합니다. 검증 데이터가 너무 많거나 너무 적어도 신경망이 학습할 때 문제가 될 수 있습니다. 보통 신경망을 훈련시킬 때 훈련 데이터와 검증 데이터의 비율을 7:3 혹은 8:2로 합니다. 하지만 비율에 정답이 있는 것은 아니니 여러 비율로 테스트해 보세요.

Noise: 분류 문제에서 실제 데이터는 정확하게 두 부분으로 나뉘지 않습니다. 데이터가 서로 섞여 있기 마련이죠. 노이즈가 0일 때는 섞여 있지 않을 때로 노이즈가 높을수록 데이터가 섞여 있는 정도가 심합니다. 그러면 신경망을 학습시킬 때 모델 설계를 더 잘해야 합니다.

Batch size: 신경망을 학습시킬 때 한 번에 학습하는 데이터양을 의미합니다. 데이터가 100개 있을 때 배치 사이즈가 100이라면 한 번 학습할 때 데이터 100개를 한꺼번에 학습시킨다는 의미입니다. 배치 사이즈가 10이라면 한 번 학습할 때 데이터 10개를 사용하겠죠.

Epoch: 전체 데이터를 한 번 학습하는 것을 의미합니다. 50 에포크라면 전체 데이터를 50번 학습한다는 의미입니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.