해상도의 변화에 따른 성능 향상
DarkNet-19는 백본(backbone) 네트워크의 역할을 합니다. 딥러닝에서 ‘백본 네트워크’는 주로 컴퓨터 비전 작업을 위한 신경망 모델에서의 기본 구조를 의미합니다. 이는 입력 이미지에서 고수준의 특징을 추출하는 역할을 하며, 일반적으로 다양한 사이즈의 합성곱 층들과 풀링 층들로 구성되어 있습니다. 백본 네트워크는 특징 추출기로서의 기능을 수행하고, 이렇게 추출된 특징들은 태스크-특화 층(예 분류기, 검출기)으로 전달되어 특정 작업을 수행하는 데 사용됩니다.
대표적인 백본 네트워크로는 4장에서 배운 VGG, 레즈넷, 구글넷 등이 있으며, 이들은 이미지 인식, 객체 감지 및 세분화와 같은 다양한 딥러닝 작업에 널리 활용됩니다. 백본 네트워크의 선택은 해당 네트워크의 성능, 계산 복잡성, 필요한 매개변수의 수와 같은 요소들에 따라 달라질 수 있습니다. 이미지 해상도가 크게 된다면 연산량이 많아져 결과적으로 모델 전체가 느려지게 되는 Trade-off 관계를 가지게 됩니다. YOLO 9000에서는 다양한 해상도의 차이에 따라 결과를 비교하여 이를 확인하였습니다.