전이 학습과 자기 지도 학습 사이의 주요 차이점은 그림 2-1과 그림 2-2에 있는 단계 (1)에서 레이블을 얻는 방식입니다. 전이 학습에서는 레이블이 데이터셋과 함께 제공된다고 가정합니다. 이런 레이블은 일반적으로 사람에 의해 만들어집니다. 자기 지도 학습에서는 훈련 샘플로부터 레이블이 유도됩니다.
자연어 처리(natural language processing, NLP) 분야의 자기 지도 학습 작업으로는 누락된 단어 예측이 있습니다. 예를 들어 “It is beautiful and sunny outside”란 문장에서 단어 sunny를 마스킹(masking)하여 “It is beautiful and [MASK] outside”를 모델에 입력으로 전달합니다. 모델은 [MASK] 위치에 들어갈 단어를 예측해야 합니다. 비슷하게 컴퓨터 비전에서는 이미지 조각을 제거하고 모델이 누락된 부분을 예측합니다. 이는 자기 지도 학습 작업의 두 가지 예일 뿐입니다. 이런 학습을 위해 훨씬 많은 방법과 패러다임이 있습니다.
요약하면 사전 작업1을 위해 수행하는 자기 지도 학습을 표현 학습(representation learning)으로 생각할 수 있습니다. 사전 훈련된 모델을 사용해 타깃 작업(또는 후속 작업(downstream task))에 미세 튜닝할 수 있습니다.