더북(TheBook)

이제 분석하기 좋게 데이터를 고치는 데이터 전처리(preprocessing)를 해야 합니다. 먼저 astype() 메서드를 이용하여 범주 특성을 갖는 데이터를 범주형(category) 타입으로 변환합니다. 또한, 파이토치를 이용한 모델 학습을 해야 하므로 범주형 타입을 텐서로 변환해야 합니다. 참고로 이번 예제에서 사용하는 데이터는 모두 범주형 데이터입니다.

코드 2-4 데이터를 범주형 타입으로 변환

categorical_columns = ['price', 'maint', 'doors', 'persons', 'lug_capacity', 'safety'] ------ 예제 데이터셋 칼럼들의 목록

for category in categorical_columns:
    dataset[category] = dataset[category].astype('category') ------ astype() 메서드를 이용하여 데이터를 범주형으로 변환

price = dataset['price'].cat.codes.values ------ ①
maint = dataset['maint'].cat.codes.values
doors = dataset['doors'].cat.codes.values
persons = dataset['persons'].cat.codes.values
lug_capacity = dataset['lug_capacity'].cat.codes.values
safety = dataset['safety'].cat.codes.values

categorical_data = np.stack([price, maint, doors, persons, lug_capacity, safety], 1)------ ②
categorical_data[:10] ------ 합친 넘파이 배열 중 열 개의 행을 출력하여 보여 줍니다.
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.