이제 단어 임베딩을 포함해 딥러닝 모델을 만들고 결과를 출력해 보겠습니다. 임베딩 함수에 필요한 세 가지 파라미터는 ‘입력, 출력, 단어 수’입니다. 총 몇 개의 단어 집합에서(입력), 몇 개의 임베딩 결과를 사용할 것인지(출력), 그리고 매번 입력될 단어 수는 몇 개로 할지(단어 수)를 정해야 하는 것입니다.
먼저 총 몇 개의 인덱스가 ‘입력’되어야 하는지 정합니다. word_size라는 변수를 만든 후
길이를 세는 len() 함수를 이용해 word_index 값을 앞서 만든 변수에 대입합니다. 이때 전체 단어의 맨 앞에 0이 먼저 나와야 하므로 총 단어 수에 1을 더하는 것을 잊지 마시기 바랍니다.
len( .word_index) + 1=
이제 몇 개의 임베딩 결과를 사용할 것인지, 즉 ‘출력’을 정할 차례입니다. 이번 예제에서는 word_size만큼 입력 값을 이용해 여덟 개의 임베딩 결과를 만들겠습니다. 여기서 8이라는 숫자는 임의로 정한 것입니다. 데이터에 따라 적절한 값으로 바꿀 수 있습니다. 이때 만들어진 여덟 개의 임베딩 결과는 우리 눈에 보이지 않습니다. 내부에서 계산해 딥러닝의 층으로 활용됩니다. 끝으로 매번 입력될 ‘단어 수’를 정합니다. 패딩 과정을 거쳐 네 개의 길이로 맞추어 주었으므로 네 개의 단어가 들어가게 설정하면 임베딩 과정은 다음 한 줄로 표현됩니다.
Embedding(8, =4),