더북(TheBook)

Note ≡ | 선택적 탐색

선택적 탐색은 객체 인식이나 검출을 위한 가능한 후보 영역(객체가 있을 만한 위치, 영역)을 알아내는 방법입니다. 선택적 탐색은 분할 방식을 이용하여 시드(seed)를 선정하고, 그 시드에 대한 완전 탐색을 적용합니다.

선택적 탐색은 다음 세 단계 과정을 거칩니다.

 

1단계. 초기 영역 생성(sub-segmentation)

각각의 객체가 영역 한 개에 할당될 수 있도록 많은 초기 영역을 생성합니다. 즉, 입력된 이미지를 영역 다수 개로 분할하는 과정입니다.

▲ 그림 6-37 R-CNN 학습 1단계

2단계. 작은 영역의 통합

1단계에서 영역 여러 개로 나눈 것들을 비슷한 영역으로 통합하는데, 이때 탐욕(greedy) 알고리즘6을 사용하여 비슷한 영역이 하나로 통합될 때까지 반복합니다.

▲ 그림 6-38 R-CNN 학습 2단계

3단계. 후보 영역 생성

2단계에서 통합된 이미지들을 기반으로 다음 그림과 같이 후보 영역(바운딩 박스)을 추출합니다.

▲ 그림 6-39 R-CNN 학습 3단계

여기에서 사용되는 용어 의미는 다음과 같습니다.

완전 탐색(exhaustive search): 후보가 될 만한 대상의 크기 및 비율이 모두 다른 상황을 고려하여 후보 영역을 찾는 기법

분할(segmentation): 영상 데이터의 특성(색상, 모양, 무늬 등)에 따라 분할하여 후보 영역을 선정하는 기법

후보 영역(바운딩 박스): 3D 객체의 형태를 모두 포함할 수 있는 최소 크기의 박스

시드(seed): 영상에서는 특정 기준점의 픽셀에서 점점 의미가 같은 영상 범위까지 픽셀을 확장해 나가면서 분할하는데, 이때 특정 기준점이 되는 픽셀

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.