3단계. 후보 영역 생성

    통합된 영역을 기반으로 후보 영역(바운딩 박스)을 추출합니다.

    ▲ 그림 6-29 R-CNN 학습 3단계

    여기에서 사용되는 용어 의미는 다음과 같습니다.

    완전 탐색(exhaustive search): 후보가 될 만한 대상의 크기 및 비율이 모두 다른 상황을 고려하여 후보 영역을 찾는 기법

    분할(segmentation): 영상 데이터의 특성(색상, 모양, 무늬 등)에 따라 분할하여 후보 영역을 선정하는 기법

    후보 영역(바운딩 박스): 3D 객체의 형태를 모두 포함할 수 있는 최소 크기의 박스

    시드(seed): 영상에서는 특정 기준점의 픽셀에서 점점 의미가 같은 영상 범위까지 픽셀을 확장해 나가면서 분할하는데, 이때 특정 기준점이 되는 픽셀

    R-CNN은 성능이 뛰어나기는 하지만 다음과 같은 단점으로 크게 발전하지는 못했습니다.

    1. 앞서 언급한 세 단계의 복잡한 학습 과정

    2. 긴 학습 시간과 대용량 저장 공간

    3. 객체 검출(object detection) 속도 문제

     

    이러한 문제를 해결하기 위해 Fast R-CNN이 생겼습니다.

    신간 소식 구독하기
    뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.