4.3.2 합성곱 신경망
합성곱 신경망(Convolutional Neural Network, CNN)은 합성곱층(convolutional layer)과 풀링층(pooling layer)을 포함하는 이미지 처리 성능이 좋은 인공 신경망 알고리즘입니다. 영상 및 사진이 포함된 이미지 데이터에서 객체를 탐색하거나 객체 위치를 찾아내는 데 유용한 신경망입니다.
▲ 그림 4-26 합성곱 신경망
합성곱 신경망은 이미지에서 객체, 얼굴, 장면을 인식하기 위해 패턴을 찾는 데 특히 유용합니다. 대표적인 합성곱 신경망으로 LeNet-5와 AlexNet이 있습니다. 또한, 층을 더 깊게 쌓은 신경망으로는 VGG, GoogLeNet, ResNet 등이 있습니다.
참고로 기존 신경망과 비교하여 다음과 같은 차별성이 있습니다.
• 각 층의 입출력 형상을 유지합니다.
• 이미지의 공간 정보를 유지하면서 인접 이미지와 차이가 있는 특징을 효과적으로 인식합니다.
• 복수 필터로 이미지의 특징을 추출하고 학습합니다.
• 추출한 이미지의 특징을 모으고 강화하는 풀링층이 있습니다.
• 필터를 공유 파라미터로 사용하기 때문에 일반 인공 신경망과 비교하여 학습 파라미터가 매우 적습니다.
합성곱 신경망은 5~6장에서 자세히 설명합니다. 여기에서는 간단히 개념만 살피고 넘어가세요.