① 범주형 데이터를 텐서로 변환하기 위해 다음과 같은 절차가 필요합니다.
범주형 데이터 → dataset[category] → 넘파이 배열(NumPy array) → 텐서(Tensor)
즉, 파이토치로 모델을 학습시키기 위해서는 텐서 형태로 변환해야 하는데, 넘파이 배열을 통해 텐서를 생성할 수 있습니다.
범주형 데이터(단어)를 숫자(넘파이 배열)로 변환하기 위해 cat.codes를 사용합니다. cat.codes는 어떤 클래스가 어떤 숫자로 매핑되어 있는지 확인이 어려운 단점이 있으므로 주의해서 사용해야 합니다.
② np.stack은 두 개 이상의 넘파이 객체를 합칠 때 사용합니다.