더북(TheBook)

아다델타(Adadelta, Adaptive delta)

아다델타는 아다그라드에서 G 값이 커짐에 따라 학습이 멈추는 문제를 해결하기 위해 등장한 방법입니다. 아다델타는 아다그라드의 수식에서 학습률(η)D 함수(가중치의 변화량(Δ) 크기를 누적한 값)로 변환했기 때문에 학습률에 대한 하이퍼파라미터가 필요하지 않습니다.

예를 들어 텐서플로 2에서는 아다델타를 다음과 같이 구현할 수 있습니다.

from tensorflow.keras.optimizers import Adadelta
model.compile(loss='categorical_crossentropy',
              optimizer=Adadelta(rho=0.95),
              metrics=['accuracy'])
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.