더북(TheBook)

이 경우 poolSize[2, 2]로 설정했기 때문에16 이미지 패치의 높이와 너비는 2 × 2입니다. 패치는 높이와 너비 차원을 따라 두 픽셀마다 추출됩니다. 패치 사이의 간격은 strides로 설정하며 여기서는 [2, 2]입니다.17 따라서 출력 이미지의 HWC 크기 [12, 12, 8]은 입력 이미지([24, 24, 8]) 높이와 너비의 절반이 됩니다. 하지만 채널 개수는 같습니다.

maxPooling2d 층은 합성곱 신경망에서 두 가지 목적이 있습니다. 첫째, 합성곱 신경망이 입력 이미지에서 주요 특성의 정확한 위치에 덜 민감하게 만듭니다. 예를 들어 28 × 28 입력 이미지의 중간에서 왼쪽이나 오른쪽으로 (또는 위나 아래로) 이동한 것과 상관없이 숫자 ‘8’을 인식해야 합니다. 이런 성질을 위치 불변성(positional invariance)이라고 합니다.18 maxPooling2d가 위치 불변성을 어떻게 향상시키는지 이해해 보죠. maxPooling2d가 연산하는 각 이미지 패치 안에서 가장 밝은 픽셀이 그 패치 안에만 있다면, 어디에 있는지는 상관없습니다. 당연히 하나의 maxPooling2d 층은 풀링 윈도가 고정되어 있기 때문에 합성곱 신경망이 이동에 민감하지 않게 만들 수 있습니다. 하지만 하나의 합성곱 신경망에서 여러 개의 maxPooling2d 층을 사용하면 아주 높은 위치 불변성을 달성할 수 있습니다. 두 개의 maxPooling2d 층을 포함하는 MNIST 모델은 물론 거의 모든 합성곱 신경망에서 사용됩니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.