wv.similarity()에 'peter'와 'wendy' 두 단어를 넘겨 주고 코사인 유사도를 구합니다.
코드 10-12 ‘peter’, ‘wendy’에 대한 코사인 유사도
sim_score = model.wv.similarity('peter', 'wendy')
print(sim_score)
다음은 'peter'와 'wendy'의 코사인 유사도 결과입니다.
0.14111584
두 단어에 대한 유사도가 매우 낮습니다. 이번에는 'peter', 'hook'의 두 단어에 대한 코사인 유사도를 구합니다.
코드 10-13 ‘peter’와 ‘hook’에 대한 코사인 유사도
sim_score = model.wv.similarity('peter', 'hook')
print(sim_score)
다음은 'peter'와 'hook'에 대한 코사인 유사도 결과입니다.
0.22405876
'peter'와 'hook' 두 단어에 대한 유사도 역시 매우 낮지만, 'peter'와 'wendy'보다는 높습니다. 앞서 설명이 있었지만, 데이터가 랜덤으로 사용되므로 결과가 책과 다를 수 있습니다.