업샘플링된 특징 맵은 이후에 이전 층에서 추출된 더 큰 특징 맵과 결합됩니다. 이 결합 과정은 네트워크에게 다양한 사이즈의 객체에 대한 정보를 통합적으로 제공합니다. 특징 맵의 결합은 네트워크가 작은 객체의 세부 사항과 함께 큰 객체의 전반적인 정보를 동시에 해석할 수 있게 해줍니다. 이는 객체 탐지의 정확도를 높이고, 더 세밀한 객체 인식을 가능하게 합니다. 결합된 특징 맵은 마지막으로 YOLO v3의 객체 탐지 층을 통과합니다. 이 층은 최종적으로 객체의 위치, 클래스 및 확률을 예측합니다. YOLO v3의 객체 탐지는 멀티 스케일 방식으로 수행되며, 이는 다양한 사이즈의 객체를 효과적으로 감지할 수 있음을 의미합니다.
객체 탐지 과정에서 중요한 점은 네트워크가 단일 이미지 분석을 통해 다양한 사이즈와 형태의 객체를 식별하고 분류한다는 것입니다. 이는 YOLO v3가 높은 정확도와 속도로 실시간 이미지 처리 및 객체 탐지를 수행할 수 있게 해줍니다.