더북(TheBook)

out_channels: 출력 채널의 수를 의미합니다.

kernel_size: 커널 크기를 의미하며 논문에 따라 필터라고도 합니다. 커널은 이미지 특징을 찾아내기 위한 공용 파라미터이며, CNN에서 학습 대상은 필터 파라미터가 됩니다. 커널은 입력 데이터를 스트라이드 간격으로 순회하면서 합성곱을 계산합니다.

참고로 kernel_size=3이라고 했을 때, 커널의 크기는 (3, 3)으로 정사각형을 의미하며 직사각형을 사용하고 싶다면 (3, 5)처럼 지정합니다.

padding: 패딩 크기를 의미하는 것으로 출력 크기를 조정하기 위해 입력 데이터 주위에 0을 채웁니다. 패딩 값이 클수록 출력 크기도 커집니다.

③ BatchNorm2d는 학습 과정에서 각 배치 단위별로 데이터가 다양한 분포를 가지더라도 평균과 분산을 이용하여 정규화하는 것을 의미합니다. 다음 그림을 보면 배치 단위나 계층에 따라 입력 값의 분포가 모두 다르지만 정규화를 통해 분포를 가우시안 형태로 만듭니다. 그러면 평균은 0, 표준편차는 1로 데이터의 분포가 조정됩니다.

▲ 그림 5-28 BatchNorm2d

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.