더북(TheBook)

6.2.3 Fast R-CNN

R-CNN은 바운딩 박스마다 CNN을 돌리고, 분류를 위한 긴 학습 시간이 문제였습니다. Fast R-CNN(Fast Region-based CNN)은 R-CNN의 속도 문제를 개선하려고 RoI 풀링을 도입했습니다. 즉, 선택적 탐색에서 찾은 바운딩 박스 정보가 CNN을 통과하면서 유지되도록 하고 최종 CNN 특성 맵은 풀링을 적용하여 완전연결층을 통과하도록 크기를 조정합니다. 이렇게 하면 바운딩 박스마다 CNN을 돌리는 시간을 단축할 수 있습니다.

▲ 그림 6-31 Fast R-CNN

Note ≡ RoI 풀링


RoI 풀링(RoI pooling)은 크기가 다른 특성 맵의 영역마다 스트라이드를 다르게 최대 풀링을 적용하여 결괏값 크기를 동일하게 맞추는 방법입니다.

예를 들어 다음 그림과 같이 박스 한 개가 픽셀 한 개를 뜻하는 특성 맵이 있다고 합시다. 즉, 8×8 특성 맵()에서 선택적 탐색으로 뽑아냈던 7×5 후보 영역()이 있으며, 이것을 2×2로 만들기 위해 스트라이드(7/2=3, 5/2=2)로 풀링 영역()을 정하고 최대 풀링을 적용하면 2×2 결과()를 얻을 수 있습니다.

 

▲ 그림 6-32 RoI 풀링

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.