더북(TheBook)

2.2.7 배치 데이터

 

일반적으로 딥러닝에서 사용하는 모든 데이터 텐서의 첫 번째 축(인덱스가 0부터 시작하므로 0번째 축)은 샘플 축(sample axis)입니다(이따금 샘플 차원(sample dimension)이라고도 부릅니다). MNIST 예제에서는 숫자 이미지가 샘플입니다.

딥러닝 모델은 한 번에 전체 데이터셋을 처리하지 않습니다. 그 대신 데이터를 작은 배치(batch)로 나눕니다. 구체적으로 말하면 MNIST 숫자 데이터에서 크기가 128인 배치 하나는 다음과 같습니다.

batch = train_images[:128]

 

그다음 배치는 다음과 같습니다.

batch = train_images[128:256]

 

그리고 n번째 배치는 다음과 같습니다.

batch = train_images[128 * n:128 * (n + 1)]

 

이런 배치 데이터를 다룰 때는 첫 번째 축(0번 축)을 배치 축(batch axis) 또는 배치 차원(batch dimension)이라고 부릅니다. 케라스나 다른 딥러닝 라이브러리를 사용할 때 이런 용어를 자주 만날 것입니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.