4.2.2 데이터 준비
이전의 예제와 동일한 코드를 사용해서 데이터를 벡터로 변환합니다.17
코드 4-13 데이터 인코딩하기
x_train = vectorize_sequences(train_data) ➊
x_test = vectorize_sequences(test_data) ➋
➊ 훈련 레이블 벡터 변환
➋ 테스트 레이블 벡터 변환
레이블을 벡터로 바꾸는 방법은 두 가지입니다. 레이블의 리스트를 정수 텐서로 변환하는 것과 원-핫 인코딩(one-hot encoding)을 사용하는 것입니다. 원-핫 인코딩이 범주형 데이터에 널리 사용되기 때문에 범주형 인코딩(categorical encoding)이라고도 부릅니다. 이 경우 레이블의 원-핫 인코딩은 각 레이블의 인덱스 자리는 1이고 나머지는 모두 0인 벡터입니다. 예를 들어 다음과 같습니다.18