그러면 이 그래프상에서 오차가 가장 작을 때는 언제일까요? 그래프의 가장 아래쪽 볼록한 부분에 이르렀을 때입니다. 즉, 기울기 a가 m의 위치에 있을 때입니다. 우리는 앞 장에서 임의의 기울기를 집어넣어 평균 제곱 오차를 구해 보았습니다. 그때의 기울기를 a1이라고 한다면, 기울기를 적절히 바꾸어 a2, a3으로 이동시키다 결국 m에 이르게 하면 최적의 기울기를 찾게 되는 것입니다. 이 작업을 위해 a1 값보다 a2 값이 m에 더 가깝고, a3 값이 a2 값보다 m에 더 가깝다는 것을 컴퓨터가 판단해야겠지요. 이러한 판단을 하게 하는 방법이 바로 미분 기울기를 이용하는 경사 하강법(gradient decent)입니다.