더북(TheBook)

◼︎ 코사인 유사도

두 벡터의 방향이 같을수록 벡터가 비슷하다고 간주하여 두 벡터 간의 각인 코사인 값을 코사인 유사도(cosine similarity)라고 합니다. 코사인 값은 각도가 0일 때 가장 크므로 두 벡터가 같은 방향을 가리키고 있으면 코사인 유사도가 최댓값 1을 갖습니다. 코사인 유사도는 그림 10-51과 같이 두 벡터가 이루는 각도로 두 벡터의 유사도를 측정하는 방식입니다.

 

그림 10-51 | 코사인 유사도

 

두 벡터가 이루는 각이 작을수록 유사도가 높고, 각이 클수록 유사도가 낮습니다.

 

코사인 유사도 공식은 다음과 같습니다.

 

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.