더북(TheBook)

6.2.2 공간 피라미드 풀링

기존 CNN 구조( 다음 그림의 R-CNN)들은 모두 완전연결층을 위해 입력 이미지를 고정해야 했습니다. 그렇기 때문에 신경망을 통과시키려면 이미지를 고정된 크기로 자르거나(crop) 비율을 조정(warp)해야 했습니다. 하지만 이렇게 하면 물체의 일부분이 잘리거나 본래의 생김새와 달라지는 문제점이 있습니다. 이러한 문제를 해결하고자 공간 피라미드 풀링(spatial pyramid pooling)을 도입했습니다.

▲ 그림 6-40 공간 피라미드 풀링

즉, 공간 피라미드 풀링은 입력 이미지의 크기에 관계없이 합성곱층을 통과시키고, 완전연결층에 전달되기 전에 특성 맵들을 동일한 크기로 조절해 주는 풀링층을 적용하는 기법입니다.

입력 이미지의 크기를 조절하지 않고 합성곱층을 통과시키기 때문에 원본 이미지의 특징이 훼손되지 않는 특성 맵을 얻을 수 있습니다. 또한, 이미지 분류나 객체 인식 같은 여러 작업에 적용할 수 있다는 장점이 있습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.