미니 배치 경사 하강법(mini-batch gradient descent)은 전체 데이터셋을 미니 배치(mini-batch) 여러 개로 나누고, 미니 배치 한 개마다 기울기를 구한 후 그것의 평균 기울기를 이용하여 모델을 업데이트해서 학습하는 방법입니다.
▲ 그림 4-21 미니 배치 경사 하강법
미니 배치 경사 하강법은 전체 데이터를 계산하는 것보다 빠르며, 확률적 경사 하강법보다 안정적이라는 장점이 있기 때문에 실제로 가장 많이 사용합니다. 다음 오른쪽 그림과 같이 파라미터 변경 폭이 확률적 경사 하강법에 비해 안정적이면서 속도도 빠릅니다.
텐서플로 2에서는 다음과 같이 구현할 수 있습니다.
model.fit(X_train, y_train, batch_size=32)
▲ 그림 4-22 확률적 경사 하강법과 미니 배치 경사 하강법