딥러닝 텐서플로 교과서: 6.2.1 R-CNN

3단계. 후보 영역 생성

통합된 영역을 기반으로 후보 영역(바운딩 박스)을 추출합니다.

▲ 그림 6-29 R-CNN 학습 3단계

여기에서 사용되는 용어 의미는 다음과 같습니다.

• 완전 탐색(exhaustive search): 후보가 될 만한 대상의 크기 및 비율이 모두 다른 상황을 고려하여 후보 영역을 찾는 기법

• 분할(segmentation): 영상 데이터의 특성(색상, 모양, 무늬 등)에 따라 분할하여 후보 영역을 선정하는 기법

• 후보 영역(바운딩 박스): 3D 객체의 형태를 모두 포함할 수 있는 최소 크기의 박스

• 시드(seed): 영상에서는 특정 기준점의 픽셀에서 점점 의미가 같은 영상 범위까지 픽셀을 확장해 나가면서 분할하는데, 이때 특정 기준점이 되는 픽셀

R-CNN은 성능이 뛰어나기는 하지만 다음과 같은 단점으로 크게 발전하지는 못했습니다.

1. 앞서 언급한 세 단계의 복잡한 학습 과정

2. 긴 학습 시간과 대용량 저장 공간

3. 객체 검출(object detection) 속도 문제

이러한 문제를 해결하기 위해 Fast R-CNN이 생겼습니다.

신간 소식 구독하기

뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.