더북(TheBook)

YOLO는 탐지하고자 하는 객체의 정보와 객체 위치를 한 번에 예측하는 통합 예측(unified detection) 시스템을 만들었습니다. 이미지 전체의 특징을 한 번에 추출하기 때문에 이미지 전체 맥락에 대한 이해가 높고 background error가 낮으며, 이미지 전체를 보면서 객체의 일반화된 특징을 학습하기 때문에 실제 사진들을 가지고 학습을 진행해도 만화책이나 책의 삽화에 등장하는 사람을 이해하고 탐지할 수 있는 특징을 가지게 됩니다. two-stage detector에 비해 장점들만 있는 것 같지만 전체를 한 번에 보는 특징 때문에 작은 객체들은 상대적으로 잘 탐지하지 못하는 단점을 가지게 됩니다.

 

 

통합 예측

YOLO의 핵심 아이디어 중 하나는 통합 예측입니다. 통합 예측을 하는 단계를 순차적으로 알아보겠습니다.

 

그리드 분할

그리드(grid)는 이미지나 다른 2차원 표면을 일정한 사이즈의 정사각형 또는 직사각형으로 분할하는 것을 의미합니다. 그리드는 복잡한 이미지나 데이터를 더 작고 관리하기 쉬운 여러 부분으로 나누는 데 도움을 줍니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.