더북(TheBook)

get_label_fromImage 함수는 주어진 XML 파일 경로와 데이터 세트 내의 클래스 목록을 입력으로 사용하여 해당 이미지에 대한 레이블을 반환합니다(①). 함수 내에는 transform_coordinates라는 내부 함수가 정의되어 있으며(②), 이 함수는 주어진 좌표와 이미지의 너비 및 높이를 사용하여 해당 좌표를 (224, 224) 사이즈의 이미지에 맞게 조정합니다(③). 그 후에 해당 좌표를 사용하여 객체의 중심 좌표와 너비, 높이를 계산합니다.

XML 파일은 파싱되어 사전 객체로 변환되며(④), 이미지의 너비와 높이 정보를 가져옵니다. 함수는 7×7 그리드와 25개의 채널을 갖는 레이블 배열을 0으로 초기화합니다(⑤). 이 배열은 YOLO 알고리즘에서 사용되는 레이블 형식을 나타냅니다. XML 파일에서 객체 정보를 가져와 각 객체의 클래스 인덱스와 경계 상자 좌표를 찾습니다(⑥). 그 후 transform_coordinates 함수를 사용하여 이 좌표를 조정하고, 객체의 중심이 속한 그리드 셀의 좌표와 그 셀 내에서의 상대적인 위치를 계산합니다(⑦). 이 정보와 클래스 정보를 사용하여 레이블 배열에 저장합니다. 마지막으로 완성된 레이블 배열이 반환됩니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.