ⓒ window: 고려할 앞뒤 폭(앞뒤 세 단어)
ⓓ min_count: 단어에 대한 최소 빈도수 제한(1회 이하 단어 무시)
ⓔ epochs: 반복 횟수(이전에는 iter를 사용했지만 현재는 epochs로 변경)
wv.similarity()에 'peter'와 'wendy' 두 단어를 넘겨주고 코사인 유사도를 구합니다.
코드 10-12 ‘peter’, ‘wendy’에 대한 코사인 유사도
sim_score = model.wv.similarity('peter', 'wendy')
print(sim_score)
다음은 'peter'와 'wendy'의 코사인 유사도 결과입니다.
0.45924556
두 단어에 대한 유사도 결과가 45%입니다. 이번에는 'peter', 'hook'의 두 단어에 대한 코사인 유사도를 구합니다.
코드 10-13 ‘peter’와 ‘hook’에 대한 코사인 유사도
sim_score = model.wv.similarity('peter', 'hook')
print(sim_score)