대조적 자기 지도 학습(contrastive self-supervised learning)에서는 비슷한 샘플은 가까이 있고 비슷하지 않은 샘플은 멀리 떨어지게 되는 임베딩 공간을 학습하도록 모델을 훈련합니다. 다른 말로 하면 비슷한 훈련 샘플 사이의 거리를 최소화하고 비슷하지 않은 샘플 사이의 거리를 최대화하는 임베딩을 만들도록 신경망을 훈련합니다.
구체적인 예시를 통해 대조 학습(contrastive learning)을 살펴보겠습니다. 랜덤한 동물 이미지로 구성된 데이터셋을 가지고 있다고 가정해 보죠. 먼저 하나의 고양이 이미지를 랜덤하게 선택합니다(레이블이 없는 데이터셋이라 가정하기 때문에 신경망은 레이블을 모릅니다). 그다음 이 고양이 이미지를 증강(augmentation), 훼손, 마스킹합니다. 예를 들면 그림 2-5처럼 랜덤한 잡음을 발생하는 층을 추가하거나 여러 방식으로 이미지를 자릅니다.