더북(TheBook)

window: 고려할 앞뒤 폭(앞뒤 세 단어)

min_count: 단어에 대한 최소 빈도수 제한(1회 이하 단어 무시)

epochs: 반복 횟수(이전에는 iter를 사용했지만 현재는 epochs로 변경)

wv.similarity()'peter''wendy' 두 단어를 넘겨주고 코사인 유사도를 구합니다.

코드 10-12 ‘peter’, ‘wendy’에 대한 코사인 유사도

sim_score = model.wv.similarity('peter', 'wendy')
print(sim_score)

다음은 'peter''wendy'의 코사인 유사도 결과입니다.

0.45924556

두 단어에 대한 유사도 결과가 45%입니다. 이번에는 'peter', 'hook'의 두 단어에 대한 코사인 유사도를 구합니다.

코드 10-13 ‘peter’와 ‘hook’에 대한 코사인 유사도

sim_score = model.wv.similarity('peter', 'hook')
print(sim_score)
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.