임베딩 모델

    임베딩을 위해서는 임베딩 모델이라는 것이 필요합니다. 많이 사용되는 것 위주로 몇 가지만 살펴보겠습니다.

     

    Word2Vec

    Word2Vec은 단어를 컴퓨터가 이해할 수 있는 숫자인 벡터로 변환하는 모델입니다. 이를 통해 컴퓨터는 단어 사이의 관계를 이해하고 비슷한 의미를 가진 단어들을 찾을 수 있습니다. 파이썬을 이용하여 구현하는 방법은 간단합니다.

    코드

    from gensim.models import Word2Vec
    
    #훈련에 사용된 데이터
    training_data = [
        ['강아지', '고양이', '두', '마리', '계단', '위', '앉아', '있다']
    ]
    #word2vec 사용하여 벡터로 변환
    word2vec_model = Word2Vec(sentences=training_data, min_count=1) 
    
    word_vector = word2vec_model.wv['강아지']  #강아지를 벡터로 변환
    word_vector
    
    신간 소식 구독하기
    뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.