더북(TheBook)

더 구체적으로, ‘사과’ 벡터 [1, 0]와 ‘수박’ 벡터 [1, 1]는 첫 번째 요소가 같으므로 어느 정도 유사하다고 볼 수 있습니다. 그러나 ‘사과’ [1, 0]와 ‘자동차’ [0, 1] 벡터는 첫 번째 숫자가 서로 다르므로 유사하지 않다고 볼 수 있습니다. 유사도를 구하는 방식 중 가장 대표적인 것이 코사인 유사도이며 다음과 같은 수식을 사용합니다.

▲ 그림 3-7 코사인 유사도

문맥과 의도 파악: 모델은 쿼리의 문맥과 의도를 고려하여 검색된 문서가 얼마나 관련이 있는지 판단합니다.

랭킹 산출: 유사도, 문맥, 정보 품질 등 다양한 요소를 종합하여 각 문서에 최종 랭킹을 매깁니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.