더북(TheBook)

4.6 요약

합성곱 신경망은 conv2d와 maxPooling2d 층의 쌍을 연속적으로 두어 입력 이미지에서 2D 공간 특성을 추출합니다.

conv2d 층은 여러 개의 채널을 가진 튜닝 가능한 공간 필터입니다. 국소성과 파라미터 공유 성질을 가지고 있어서 강력한 특성 추출기의 역할을 하며 효율적인 표현 변환을 수행합니다.

maxPooling2d 층은 고정 윈도 안에 최댓값을 선택하는 식으로 입력 이미지 텐서의 크기를 줄입니다. 이를 통해 위치 불변성을 향상시킵니다.

합성곱 신경망의 conv2d-maxPooling2d 쌍은 일반적으로 flatten 층으로 끝납니다. 그다음, 분류나 회귀 작업을 위해 밀집 층으로 만든 MLP가 뒤따릅니다.

브라우저는 자원에 제약이 많으므로 작은 모델을 훈련하기에 적합합니다. 대규모 모델을 훈련하려면 TensorFlow.js의 Node.js 버전인 tfjs-node를 사용하는 것이 바람직합니다. tfjs-node는 텐서플로의 파이썬 버전이 사용하는 CPU 커널과 GPU 병렬 처리 커널을 동일하게 사용할 수 있습니다.

모델 용량이 클수록 과대적합의 위험이 커집니다. 합성곱 신경망에서는 드롭아웃 층을 추가하여 과대적합을 줄일 수 있습니다. 드롭아웃 층은 훈련하는 동안 입력 원소의 일부를 랜덤하게 0으로 만듭니다.

합성곱 신경망은 컴퓨터 비전 작업에만 사용하지 않습니다. 오디오 신호가 스펙트로그램으로 표현되면, 합성곱 신경망을 여기에 적용하여 높은 분류 정확도를 달성할 수도 있습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.