더북(TheBook)

임베딩은 원본 입력보다 차원이 적을 수도 있고 많을 수도 있습니다. 예를 들어 임베딩을 극단적으로 사용하면 그림 1-2와 같이 시각화와 군집(clustering)을 위해 데이터를 조밀하고 연속적인 2차원 표현으로 인코딩할 수 있습니다.

▲ 그림 1-2 2차원 특성 공간(feature space)에 매핑된 단어(왼쪽)와 이미지(오른쪽)

임베딩의 기본 속성은 거리(distance)나 유사도(similarity)를 인코딩하는 것입니다. 이는 비슷한 입력이 임베딩 공간에서 가까이 놓이도록 데이터의 의미를 포착한다는 의미입니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.