전통적으로는 여러 마스크 후보 중 각 픽셀의 신뢰도(confidence)를 평균 내어 단일 마스크를 선택하는 방식이 사용되었습니다. 하지만 이 방법은 마스크에 노이즈를 많이 유발하며, 사용자의 의도와 일치하는 정확한 마스크를 제공하는 데 한계가 있었습니다.
SAM은 한 가지 대신 세 가지 마스크 후보를 제공하는 방법을 채택합니다. 이는 사용자의 의도를 더 정확하게 파악하고, 적합한 마스크를 선택할 수 있는 기회를 늘립니다. 이어서 제시된 세 개의 마스크 후보 중에서 최소 손실을 갖는 마스크에 대해 학습(backpropagation, 역전파)을 수행합니다. 이는 마스크의 정확도를 높이고, 사용자의 의도에 더 부합하는 결과를 얻기 위한 전략입니다. 이 방법은 모호성을 줄이고, 마스크의 정확성을 향상시킵니다. 사용자가 지정한 점에 대해 더 정확한 마스크를 생성할 수 있습니다. 추가로 다중 마스크 후보와 최소 손실 학습 방법은 사용자의 의도를 더 잘 반영할 수 있게 합니다. 이는 특히 복잡하고 모호한 이미지 분석에서 중요한 역할을 합니다.