더북(TheBook)

이제 각 경계 상자가 어떤 정보를 포함하고 있는지 살펴보겠습니다. 각 바운딩 박스는 총 다섯 가지의 정보를 예측합니다. 이 정보들은 바로 x, y 좌표, 너비(w), 높이(h) 그리고 앞서 언급했던 신뢰도입니다. 여기서 x, y 좌표는 바운딩 박스의 중심점을 나타내며, 이 좌표는 그리드 셀 내에서의 상대적 위치로 표현됩니다. 예를 들어 만약 그리드 셀의 왼쪽 상단 모서리를 기준으로 바운딩 박스의 중심이 그리드 셀의 정중앙에 위치한다면, x와 y 좌표는 각각 0.5, 0.5로 예측될 것입니다.

너비와 높이는 전체 이미지에 대한 상대적인 사이즈로 예측됩니다. 예를 들면 이미지 전체의 너비나 높이에 대한 비율로 표현됩니다. 만약 예측된 바운딩 박스가 이미지 전체의 너비의 절반, 높이의 사이즈를 가진다면, w와 h는 각각 0.5와 0.25로 예측됩니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.