더북(TheBook)

Conv2d 계층에서의 출력 크기 구하는 공식

출력 크기 = (W-F+2P)/S+1

W: 입력 데이터의 크기(input_volume_size)

F: 커널 크기(kernel_size)

P: 패딩 크기(padding_size)

S: 스트라이드(strides)

 

예를 들어 첫 번째 Conv2d 계층은 다음과 같습니다.

nn.Conv2d(in_channels=1, out_channels=32, kernel_size=3, padding=1)

따라서 출력 크기는 다음과 같이 계산할 수 있습니다.

(784 - 3 + (2 * 1))/1 + 1 = 784

(fashion_mnist의 입력 데이터 크기는 784이며, stride가 명시되어 있지 않다면 stride기본값은 (1,1)입니다)

계산 결과를 적용하면 출력의 형태는 [32, 784, 784]가 됩니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.