3단계. 후보 영역 생성
통합된 영역을 기반으로 후보 영역(바운딩 박스)을 추출합니다.
▲ 그림 6-29 R-CNN 학습 3단계
여기에서 사용되는 용어 의미는 다음과 같습니다.
• 완전 탐색(exhaustive search): 후보가 될 만한 대상의 크기 및 비율이 모두 다른 상황을 고려하여 후보 영역을 찾는 기법
• 분할(segmentation): 영상 데이터의 특성(색상, 모양, 무늬 등)에 따라 분할하여 후보 영역을 선정하는 기법
• 후보 영역(바운딩 박스): 3D 객체의 형태를 모두 포함할 수 있는 최소 크기의 박스
• 시드(seed): 영상에서는 특정 기준점의 픽셀에서 점점 의미가 같은 영상 범위까지 픽셀을 확장해 나가면서 분할하는데, 이때 특정 기준점이 되는 픽셀
R-CNN은 성능이 뛰어나기는 하지만 다음과 같은 단점으로 크게 발전하지는 못했습니다.
1. 앞서 언급한 세 단계의 복잡한 학습 과정
2. 긴 학습 시간과 대용량 저장 공간
3. 객체 검출(object detection) 속도 문제
이러한 문제를 해결하기 위해 Fast R-CNN이 생겼습니다.