더북(TheBook)

마지막으로 레이블(outputs)로 사용할 칼럼에 대해서도 텐서로 변환해 줍니다. 이번에는 get_dummies를 이용하여 넘파이 배열로 변환합니다.

코드 2-6 레이블로 사용할 칼럼을 텐서로 변환

outputs = pd.get_dummies(dataset.output) ------ ①
outputs = outputs.values
outputs = torch.tensor(outputs).flatten() ------ 1차원 텐서로 변환

print(categorical_data.shape)
print(outputs.shape)

get_dummies는 가변수(dummy variable)로 만들어 주는 함수입니다. 가변수로 만들어 준다는 의미는 문자를 숫자 (0, 1)로 바꾸어 준다는 의미입니다. 예를 위해 성별(gender), 몸무게(weight), 국적(nation)이라는 칼럼을 갖는 배열을 생성해 보겠습니다.

import pandas as pd
import numpy as np

data = {
    'gender' : ['male','female','male'],
    'weight' : [72,55,68],
    'nation' : ['Japan','Korea','Australia']
}

df = pd.DataFrame(data)
df
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.