더북(TheBook)


관련 용어를 정리해요!

① Ratio of training to test data: 훈련 데이터와 검증 데이터를 나누는 비율을 의미합니다. 검증 데이터가 너무 많거나 너무 적어도 신경망이 학습할 때 문제가 될 수 있습니다. 보통 신경망을 훈련시킬 때 훈련 데이터와 검증 데이터의 비율을 7:3 혹은 8:2로 합니다. 하지만 비율에 정답이 있는 것은 아니니 여러 비율로 테스트해 보세요.

② Noise: 분류 문제에서 실제 데이터는 정확하게 두 부분으로 나뉘지 않습니다. 데이터가 서로 섞여 있기 마련이죠. Noise가 0일 때에는 섞여 있지 않을 때를 말하며, Noise가 높아질수록 데이터가 섞여 있는 정도가 심해집니다. 그러면 신경망을 학습시킬 때 모델 설계를 더 잘해야 합니다.

③ Batch Size: 신경망을 학습시킬 때 한 번에 학습하는 데이터의 양을 말합니다. 만약 데이터가 100개가 있을 때 Batch Size(배치 사이즈)가 100이라면 한 번 학습할 때 데이터 100개를 한꺼번에 학습시킨다는 의미입니다. 만약 Batch Size가 10이라면 한 번 학습할 때 데이터 10개를 사용하겠죠.

④ Epoch: Epoch(에포크)란 전체 데이터를 한 번 학습하는 것을 의미합니다. 만약 50Epoch라면 전체 데이터를 50번 학습한다는 의미입니다.

입력값을 수정해 보면서 어떤 입력값이 가장 좋은 모델을 만드는 데 사용될 수 있는지 살펴볼 수 있습니다. FEATURES에서 데이터의 모습과 비슷한 입력을 선택하니 금방 학습이 진행되는 것을 확인할 수 있습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.