더북(TheBook)

임베딩 모델

임베딩을 위해서는 임베딩 모델이라는 것이 필요합니다. 많이 사용되는 것 위주로 몇 가지만 살펴보겠습니다.

 

Word2Vec

Word2Vec은 단어를 컴퓨터가 이해할 수 있는 숫자인 벡터로 변환하는 모델입니다. 이를 통해 컴퓨터는 단어 사이의 관계를 이해하고 비슷한 의미를 가진 단어들을 찾을 수 있습니다. 파이썬을 이용하여 구현하는 방법은 간단합니다.

코드

from gensim.models import Word2Vec

#훈련에 사용된 데이터
training_data = [
    ['강아지', '고양이', '두', '마리', '계단', '위', '앉아', '있다']
]
#word2vec 사용하여 벡터로 변환
word2vec_model = Word2Vec(sentences=training_data, min_count=1) 

word_vector = word2vec_model.wv['강아지']  #강아지를 벡터로 변환
word_vector
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.