더북(TheBook)

 

SECTION 3.1 데이터셋과 용어

지도 학습은 훈련 데이터셋에서 모델을 훈련하고 테스트 데이터셋에서 모델을 평가합니다. 일반적으로 훈련 세트는 비교적 클래스당 샘플 개수가 많습니다. 예를 들어 지도 학습에서는 클래스당 50개의 샘플이 있는 붓꽃 데이터셋을 매우 작은 데이터셋으로 볼 수 있습니다. 반면 딥러닝에서는 클래스당 5,000개의 샘플이 있는 MNIST 같은 데이터셋도 매우 작다고 여깁니다.

퓨-샷 학습에서 클래스당 샘플 개수는 훨씬 작습니다. 퓨-샷 학습 작업을 구성할 때 일반적으로 N-웨이 K-샷(N-way K-shot)이란 용어를 사용합니다. 여기에서 N은 클래스 개수를 나타내고 K는 클래스당 샘플 개수를 나타냅니다. 가장 일반적인 값은 K = 1 또는 K = 5입니다. 예를 들어 5-웨이 1-샷 문제는 5개의 클래스가 각각 하나의 샘플만 가지고 있습니다. 그림 3-1은 더 작은 샘플로 이 개념을 설명하기 위해 3-웨이 1-샷 설정을 보여 줍니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.