임베딩 모델
임베딩을 위해서는 임베딩 모델이라는 것이 필요합니다. 많이 사용되는 것 위주로 몇 가지만 살펴보겠습니다.
Word2Vec
Word2Vec은 단어를 컴퓨터가 이해할 수 있는 숫자인 벡터로 변환하는 모델입니다. 이를 통해 컴퓨터는 단어 사이의 관계를 이해하고 비슷한 의미를 가진 단어들을 찾을 수 있습니다. 파이썬을 이용하여 구현하는 방법은 간단합니다.
코드
from gensim.models import Word2Vec #훈련에 사용된 데이터 training_data = [ ['강아지', '고양이', '두', '마리', '계단', '위', '앉아', '있다'] ] #word2vec 사용하여 벡터로 변환 word2vec_model = Word2Vec(sentences=training_data, min_count=1) word_vector = word2vec_model.wv['강아지'] #강아지를 벡터로 변환 word_vector