더북(TheBook)

속도와 운동량에 대한 혼용 방법

아담(Adam, Adaptive Moment Estimation)

아담은 모멘텀과 알엠에스프롭의 장점을 결합한 경사 하강법입니다. 알엠에스프롭 특징인 기울기의 제곱을 지수 평균한 값과 모멘텀 특징인 v(i)를 수식에 활용합니다. 즉, 알엠에스프롭의 G 함수와 모멘텀의 v(i)를 사용하여 가중치를 업데이트합니다.

예를 들어 파이토치에서는 다음과 같이 아담을 구현할 수 있습니다.

optimizer = torch.optim.Adam(model.parameters(), lr=0.01) ------ 학습률 기본값은 1e-3
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.