'peter'와 'wendy'의 유사성을 출력한 결과입니다.
Cosine similarity between 'peter' 'wendy' - Skip Gram : 0.40088683
CBOW와 다르게 'peter'와 'wendy'의 코사인 유사도가 40%로 떨어졌습니다.
이번에는 'peter'와 'hook'의 유사성에 대해 알아보겠습니다.
코드 10-10 ‘peter’와 ‘hook’의 유사성
print("Cosine similarity between 'peter' " + "'hook' - Skip Gram : ", model2.wv.similarity('peter', 'hook'))
다음은 'peter'와 'hook'의 유사성에 대한 출력 결과입니다.
Cosine similarity between 'peter' 'hook' - Skip Gram : 0.52016735
'peter'와 'hook'의 코사인 유사도 역시 CBOW와 다르게 관계성이 52%로 높아졌습니다.
즉, CBOW와 skip-gram 중 어떤 알고리즘이 더 좋다고 결론을 내리기보다는 분석하고자 하는 데이터 성격, 분석에 대한 접근 방법 및 도출하고자 하는 결론 등을 종합적으로 고려하여 필요한 라이브러리를 사용할 수 있어야 합니다.