더북(TheBook)

이때 해당 RoI 좌표를 특징 맵 상의 좌표로 투영하려면 각 좌표를 32로 나눠주면 됩니다. 따라서 변환된 RoI는 대략 [4.0625, 3.4375, 5.9375, 3.4375]가 됩니다. 하지만 실제 특징 맵에서는 픽셀 단위로 정보를 처리해야 하기 때문에 소수점 이하의 값을 가진 좌표는 적용하기 어렵습니다. 따라서 반올림을 통해 좌표를 정수 값으로 변환해야 합니다. 반올림을 적용한 결과, 특징 맵 상의 RoI 좌표는 대략 [4, 3, 6, 3]으로 예상됩니다.

이렇게 변환된 RoI 좌표를 이용하여 특징 맵에서 해당 영역의 정보를 추출하고, 이를 바탕으로 객체를 탐지하고 분류하는 작업을 수행하게 됩니다. 이런 축소된 상태를 활용하여, 원본 이미지의 RoI 좌표를 특징 맵에 해당하는 RoI 좌표로 변환할 수 있습니다. 이 변환 작업을 ‘RoI 투영’이라고 합니다. 그러나 이러한 작업을 거치게 된다면 여러 개의 객체가 있을 경우 제 각각의 RoI 사이즈를 가지게 되어 완전 연결 층에 전달할 수 없게 됩니다. 이 문제를 해결하기 위해, RoI 풀링(RoI Pooling)이 사용됩니다. RoI 풀링은 변환된 RoI 영역에서 고정된 크기의 특징 벡터를 추출하여, 모든 RoI를 동일한 차원의 출력으로 변환합니다. 이를 바탕으로 객체를 탐지하고 분류하는 작업을 수행하게 됩니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.