더북(TheBook)

'peter''wendy'의 유사성을 출력한 결과입니다.

Cosine similarity between 'peter' 'wendy' - Skip Gram : 0.31566966

CBOW와 다르게 'peter''wendy'의 코사인 유사도가 31%로 떨어졌습니다.

이번에는 'peter''hook'의 유사성에 대해 알아보겠습니다.

코드 10-10 ‘peter’와 ‘hook’의 유사성

print("Cosine similarity between 'peter' " +
          "'hook' - Skip Gram : ",
      model2.similarity('peter', 'hook'))

다음은 'peter''hook'의 유사성에 대한 출력 결과입니다.

Cosine similarity between 'peter' 'hook' - Skip Gram : 0.5157193

'peter''hook'의 코사인 유사도 역시 CBOW와 다르게 관계성이 51%로 높아졌습니다.

즉, CBOW와 skip-gram 중 어떤 알고리즘이 더 좋다고 결론을 내리기보다는 분석하고자 하는 데이터 성격, 분석에 대한 접근 방법 및 도출하고자 하는 결론 등을 종합적으로 고려하여 필요한 라이브러리를 사용할 수 있어야 합니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.