더북(TheBook)

6.2 객체 인식을 위한 신경망

객체 인식(object detection)은 이미지나 영상 내에 있는 객체를 식별하는 컴퓨터 비전 기술입니다. 즉, 객체 인식이란 이미지나 영상 내에 있는 여러 객체에 대해 각 객체가 무엇인지 분류하는 문제와 그 객체 위치가 어디인지 박스(bounding box)로 나타내는 위치 검출(localization) 문제를 다루는 분야입니다.

따라서 객체 인식은 다음과 같이 표현할 수 있습니다.

객체 인식 = 여러 가지 객체에 대한 분류 + 객체의 위치 정보를 파악하는 위치 검출

딥러닝을 이용한 객체 인식 알고리즘은 크게 1단계 객체 인식(1-stage detector)과 2단계 객체 인식(2-stage detector)으로 나눌 수 있습니다.

▲ 그림 6-35 1단계 객체 인식 vs 2단계 객체 인식 흐름도

1단계 객체 인식은 이 두 문제(분류와 위치 검출)를 동시에 행하는 방법이고, 2단계 객체 인식은 이 두 문제를 순차적으로 행하는 방법입니다. 따라서 1단계 객체 인식은 비교적 빠르지만 정확도가 낮고, 2단계 객체 인식은 비교적 느리지만 정확도가 높습니다.

2단계 객체 인식은 CNN을 처음으로 적용시킨 R-CNN 계열이 대표적이며, 1단계 객체 인식에는 YOLO(You Only Look Once) 계열과 SSD 계열 등이 포함됩니다.

참고로 객체 인식은 자율 주행 자동차, CCTV, 무인 점포 등 많은 곳에서 활용합니다.

여기에서는 2단계 객체 인식 알고리즘을 알아보겠습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.