더북(TheBook)

2 전이 학습으로 모델 성능 극대화하기

 

그림 20-4 | 이미지넷 데이터셋에서 추출한 사진들2

 

사진은 이미지넷(ImageNet) 데이터셋에서 추출한 사진들로 구성된 것입니다. 이미지넷은 1,000가지 종류로 나뉜 120만 개가 넘는 이미지를 놓고 어떤 물체인지 맞히는 ‘이미지넷 이미지 인식 대회(ILSVRC)’에 사용되는 데이터셋입니다. MNIST와 더불어 가장 유명한 데이터셋 중 하나이지요. 전체 크기가 200GB에 이를 만큼 커다란 이 데이터를 놓고 그동안 수많은 그룹이 경쟁하며 최고의 분류기를 만들기 위해 노력해 왔습니다.

치매/일반인 뇌 사진 분류 프로젝트를 하고 있는 우리에게도 이 자료가 중요한 이유는 지금부터 이 방대한 양의 데이터셋에서 추출한 정보를 가져와서 우리 예측률을 극대화하는 ‘전이 학습’을 할 것이기 때문입니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.