더북(TheBook)

4.3.2 합성곱 신경망

합성곱 신경망(Convolutional Neural Network, CNN)은 합성곱층(convolutional layer)과 풀링층(pooling layer)을 포함하는 이미지 처리 성능이 좋은 인공 신경망 알고리즘입니다. 영상 및 사진이 포함된 이미지 데이터에서 객체를 탐색하거나 객체 위치를 찾아내는 데 유용한 신경망입니다.

▲ 그림 4-25 합성곱 신경망

합성곱 신경망은 이미지에서 객체, 얼굴, 장면을 인식하기 위해 패턴을 찾는 데 특히 유용합니다. 대표적인 합성곱 신경망으로 LeNet-5와 AlexNet이 있습니다. 또한, 층을 더 깊게 쌓은 신경망으로는 VGG, GoogLeNet, ResNet 등이 있습니다.

참고로 기존 신경망과 비교하여 다음과 같은 차별성이 있습니다.

각 층의 입출력 형상을 유지합니다.

이미지의 공간 정보를 유지하면서 인접 이미지와 차이가 있는 특징을 효과적으로 인식합니다.

복수 필터로 이미지의 특징을 추출하고 학습합니다.

추출한 이미지의 특징을 모으고 강화하는 풀링층이 있습니다.

필터를 공유 파라미터로 사용하기 때문에 일반 인공 신경망과 비교하여 학습 파라미터가 매우 적습니다.

합성곱 신경망은 5~6장에서 자세히 설명합니다. 여기에서는 간단히 개념만 살피고 넘어가세요.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.