딥러닝 텐서플로 교과서: 10.2.3 엘모

slide 1 of 18, currently active
slide 2 of 18
slide 3 of 18
slide 4 of 18
slide 5 of 18
slide 6 of 18
slide 7 of 18
slide 8 of 18
slide 9 of 18
slide 10 of 18
slide 11 of 18
slide 12 of 18
slide 13 of 18
slide 14 of 18
slide 15 of 18
slide 16 of 18
slide 17 of 18
slide 18 of 18

인코더와 디코더를 포함하여 데이터셋에 대한 전처리를 진행합니다.

def encode(le, labels):
    enc = le.transform(labels) ------ 각 열에 대한 인코딩을 가져와서 enc에 저장
    return keras.utils.to_categorical(enc) ------ enc에 저장된 데이터에 원-핫 인코딩을 적용

def decode(le, one_hot):
    dec = np.argmax(one_hot, axis=1) ------ ①
    return le.inverse_transform(dec) ------ encode() 함수에서 인코딩된 값을 디코딩(즉, 원래 값을 반환)

test = encode(le, ['ham', 'spam', 'ham', 'ham']) ------ ‘ham’, ‘spam’, ‘ham’, ‘ham’을 label로 받은 후 원-핫 인코딩을 적용
untest = decode(le, test) ------ test의 원래 값(디코딩된 값)을 untest에 저장

x_enc = x
y_enc = encode(le, y) ------ y 값에 인코딩을 적용하여 y_enc에 저장

x_train = np.asarray(x_enc[:5000]) ------ ②
y_train = np.asarray(y_enc[:5000])

x_test = np.asarray(x_enc[5000:])
y_test = np.asarray(y_enc[5000:])

신간 소식 구독하기

뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.