• 백본 네트워크(backbone network): 모델의 기본 구조로, 입력 이미지에서 기본적인 특징들을 추출하는 역할을 합니다. 백본 네트워크는 일반적으로 깊은 신경망으로 구성되어 있으며, 이미지 내의 다양한 시각적 패턴을 학습합니다.
• 특징 추출 피라미드 네트워크(Feature Pyramid Network, FPN): FPN은 백본 네트워크에서 추출한 특징 맵의 정보를 다양한 스케일에서 통합합니다. 이러한 통합은 모델이 이미지의 다양한 사이즈와 형태의 객체를 효과적으로 탐지하도록 돕습니다.
• 예측 네트워크(Prediction Network): 이 부분은 통합된 피쳐 맵을 바탕으로 최종 객체 탐지를 수행합니다. 여기에는 객체의 위치, 사이즈, 클래스 등을 예측하는 다양한 층과 메커니즘이 포함됩니다.