더북(TheBook)

7.4.1 RNN 셀 구현

예제를 진행하기에 앞서 아나콘다 프롬프트에서 다음 명령을 실행합니다.

> pip install --user torchtext

torchtext는 자연어 처리(NLP) 분야에서 사용하는 데이터로더(DataLoader)입니다. torchtext는 파일 가져오기, 토큰화4, 단어 집합5 생성, 인코딩6, 단어 벡터7 생성 등의 작업을 지원하기 때문에 자연어 처리에서 많이 사용되고 있습니다.

먼저 필요한 라이브러리들을 호출합니다.

코드 7-3 라이브러리 호출

import torch
import torchtext
import numpy as np
import torch.nn as nn
import torch.nn.functional as F
import time

다음은 예제에서 사용할 데이터셋을 전처리하기 위한 구문입니다.

코드 7-4 데이터 전처리

start = time.time()
TEXT = torchtext.legacy.data.Field(lower=True, fix_length=200, batch_first=False) ------ ①
LABEL = torchtext.legacy.data.Field(sequential=False) ------ ②
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.