이 손실 표면이 그릇 모양이고 (가장 낮은) 최상의 값은 {bias: 0.08, kernel: 0.07} 근처입니다. 이는 데이터에서 찾은 직선의 기하학적 구조와 맞습니다. 파일 크기가 거의 0에 가까울 때 다운로드 시간이 약 0.10초 걸립니다.10 모델의 랜덤 초기화는 무작위한 파라미터 값에서 시작합니다. 즉, 이 지도의 랜덤한 위치를 의미하며 여기에서 초기 손실을 계산합니다. 그다음에는 피드백 신호를 기반으로 점진적으로 파라미터를 조정합니다. 이 점진적인 조정을 훈련이라고 부르며 머신 러닝에 있는 ‘러닝’에 해당합니다. 이 과정이 그림 2-6에 나타난 훈련 루프 안에서 수행됩니다.
▲ 그림 2-6 경사 하강법을 통해 모델을 업데이트하는 훈련 루프를 보여 주는 플로차트