더북(TheBook)

max_length=8stride=2인 두 번째 데이터 로더를 만드는 코드는 다음과 같습니다.

dataloader = create_dataloader(
    raw_text, batch_size=4, max_length=8, stride=2
)

만들어진 배치는 다음과 같습니다.

tensor([[   40,   367,  2885,  1464,  1807,  3619,   402,   271],
        [ 2885,  1464,  1807,  3619,   402,   271, 10899,  2138],
        [ 1807,  3619,   402,   271, 10899,  2138,   257,  7026],
        [  402,   271, 10899,  2138,   257,  7026, 15632,   438]])

본문으로

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.