Chapter 2
1 역주 토큰 ID와 같은 정수는 토큰 사이에 의도치 않는 순서 개념을 부여하게 되며, 이 정수를 원-핫 인코딩할 경우 모든 토큰 사이의 거리가 동일해져 비슷한 토큰 사이의 의미를 포착할 수 없습니다.
2 역주 다양한 임베딩과 RAG에 대해서는 <핸즈온 LLM>(한빛미디어, 2025)을 참고하세요.
3 역주 LLM에서 임베딩 크기, 임베딩 차원, 은닉 크기, 은닉 차원은 모두 같은 의미로 사용됩니다.
4 역주 모델 파라미터 크기를 나타낼 때 M은 100만을 의미하며, B는 10억을 나타냅니다. 따라서 117M은 1억 1,700만이고, 175B는 1,750억입니다.
5 역주 이디스 워튼은 미국의 소설가입니다. 『순수의 시대』로 1921년에 퓰리처 상을 수상했으며 1993년에 동명의 영화로도 제작되었습니다.