이미지 처리 바이블: 5.2.1 YOLO

['aeroplane', 'bicycle', 'bird', 'boat', 'bottle', 'bus', 'car', 'cat', 'chair', 'cow', 'diningtable', 'dog', 'horse', 'motorbike', 'person', 'pottedplant', 'sheep', 'sofa', 'train', 'tvmonitor']

VOC 데이터 세트 내에 어떤 클래스의 객체들이 있는지 파악하는 것은 중요합니다. 코드는 이러한 기능을 제공하기 위해 작성되었습니다. 함수 get_Classes_inImage는 VOC 데이터 세트의 XML 주석 파일들 중 객체 클래스를 분석하여 리스트로 반환합니다.

각 XML 파일을 순회하며 해당 파일을 읽습니다. xmltodict 라이브러리를 사용하여 XML 형식의 내용을 파이썬의 딕셔너리 형태로 변환합니다. 각 XML 파일은 해당 이미지에 대한 주석 정보를 담고 있습니다. 이미지에 포함된 객체들의 정보가 주석으로 기록되어 있으며, 이 정보 중 객체의 클래스 이름(name)을 추출합니다.

XML 주석 중, 하나의 이미지에 여러 객체가 포함된 경우와 단 하나의 객체만 포함된 경우를 구분하여 처리합니다. 여러 객체가 포함된 경우 각 객체의 정보를 순회하며 클래스 이름을 가져오고, 단일 객체만 있는 경우에는 바로 해당 객체의 클래스 이름을 가져옵니다.

신간 소식 구독하기

뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.