더북(TheBook)

 

SECTION 2.7 토큰 임베딩 만들기

LLM 훈련을 위한 입력 텍스트 준비의 마지막 단계는 그림 2-15와 같이 토큰 ID를 임베딩 벡터로 변환하는 것입니다. 준비 단계에서는 이런 임베딩 벡터를 랜덤한 값으로 초기화합니다. 이런 초기화는 LLM 학습 과정의 시작점 역할을 합니다. 5장에서 LLM을 훈련하면서 임베딩 벡터를 최적화하겠습니다.