데이터 형태에 따라 연속형 데이터와 명목형 데이터로 분류합니다.
코드 3-31 연속형 데이터와 명목형 데이터로 분류
categorical_features = ['Channel', 'Region'] ------ 명목형 데이터
continuous_features = ['Fresh', 'Milk', 'Grocery', 'Frozen', 'Detergents_Paper', 'Delicassen'] ------ 연속형 데이터
for col in categorical_features:
dummies = pd.get_dummies(data[col], prefix=col) ------ 명목형 데이터는 판다스의 get_ dummies() 메서드를 사용하여 바이너리로 변환
data = pd.concat([data, dummies], axis=1)
data.drop(col, axis=1, inplace=True)
data.head()
코드를 실행하면 다음과 같이 연속형 데이터와 명목형 데이터로 분류됩니다.
▲ 그림 3-33 예제 데이터를 연속형 데이터와 명목형 데이터로 분류