더북(TheBook)

큰 아이디어는 위와 같지만, 몇 가지 문제점이 존재했습니다. 예를 들어 특징 맵을 추출하는 합성곱 신경망을 앞서 배운 레스넷을 사용했다면 입력 이미지는 224×224 사이즈로 들어오고, 출력 특징 맵은 7×7이 됩니다. 이 경우 원본 이미지 대비 특징 맵은 약 32배 축소된 상태입니다.

그로 인해 탐지하고자 하는 관심 영역 또한 그만큼 작아지게 됩니다. 여기서 관심 영역이 RoI입니다. 이렇게 축소된 RoI는 다른 문제가 있었습니다.

▲ 그림 5-14 RoI 문제점

바로 RoI 좌표가 정수형이 아닌 실수형으로 표현이 될 수밖에 없는 문제입니다. 원본 이미지에서의 RoI 좌표를 [130, 110, 190, 110]으로 가정해봅시다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.