더북(TheBook)

비슷하게 절편에 대한 손실의 편도 함수를 계산합니다.

분자에 있는 2는 단순한 상수 곱셈 계수이므로 알고리즘에 영향을 미치지 않고 삭제할 수 있습니다. 상수 계수를 삭제하는 것은 학습률을 2배로 줄이는 것과 동일한 효과가 있습니다. 이어지는 노트에서 이 상수 계수가 어디서 왔는지 설명합니다.

이제 가중치 업데이트를 다음과 같이 쓸 수 있습니다.

모든 파라미터를 동시에 업데이트하기 때문에 아달린 학습 규칙은 다음과 같습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.