CNN을 활용한 특징 추출
객체 탐지에서 이미지의 각 부분에 대한 정확한 정보와 패턴을 파악하는 것은 중요합니다. 이를 위해 R-CNN은 선택적 검색으로 추출된 영역 제안들을 합성곱 신경망을 통해 분석합니다.
선택적 검색으로부터 얻은 다양한 사이즈와 형태의 영역 제안들은 일정한 사이즈로 변환되어야 합니다. 이는 CNN이 고정된 사이즈의 입력만을 받아들일 수 있기 때문입니다. R-CNN은 이러한 영역 제안들을 CNN의 입력 사이즈에 맞게 변환하고, 그 후 해당 영역들을 CNN을 통과시켜 각 영역에 대한 특징을 추출합니다. 특징 추출의 핵심은 이미지의 원래 정보나 패턴을 압축하되 객체를 정확하게 분류하고 위치를 지정하는 데 필요한 주요 정보는 유지하는 것입니다. R-CNN에서 사용된 CNN 구조는 이러한 작업을 위해 합성곱 층, 풀링 층, 및 완전 연결 층을 사용합니다.
▲ 그림 5-7 R-CNN 프로세스