더북(TheBook)

▲ 그림 2-13 효율적인 데이터 로더를 구축하기 위해 텐서 x에 입력을 모읍니다. 이 텐서의 각 행은 하나의 입력 문맥을 나타냅니다. 두 번째 텐서 y는 입력에 상응하는 예측 타깃(다음 단어)을 담고 있습니다. 타깃은 입력에서 한 토큰만큼 이동하여 생성됩니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.