더북(TheBook)

그림 13-9(b)에서 노란색 실선은 셀을 구분하는 선이고, 빨간색 사각형은 블록 하나를 나타냅니다. 하나의 블록에는 네 개의 셀이 있고 각 셀에는 아홉 개의 빈으로 구성된 히스토그램 정보가 있으므로, 블록 하나에서는 총 36개의 실수 값으로 이루어진 방향 히스토그램 정보가 추출됩니다. 블록은 가로와 세로 방향으로 각각 한 개의 셀만큼 이동하면서 정의합니다. 그러므로 64×128 영상에서 블록은 가로 방향으로 일곱 개, 세로 방향으로 15개 정의할 수 있습니다. 결국 64×128 영상에서 105개의 블록이 추출될 수 있고, 전체 블록에서 추출되는 방향 히스토그램 실수 값 개수는 105×36=3780이 됩니다. 이 3780개의 실수 값이 64×128 영상을 표현하는 HOG 특징 벡터 역할을 합니다. 그림 13-9(c)는 각 셀에서 계산된 그래디언트 방향 히스토그램을 비주얼하게 표현한 결과입니다.

▲ 그림 13-9 HOG 알고리즘

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.