더북(TheBook)

데이터 형태에 따라 연속형 데이터와 명목형 데이터로 분류합니다.

코드 3-31 연속형 데이터와 명목형 데이터로 분류

categorical_features = ['Channel', 'Region'] ------ 명목형 데이터
continuous_features = ['Fresh', 'Milk', 'Grocery', 'Frozen', 'Detergents_Paper', 'Delicassen'] ------ 연속형 데이터

for col in categorical_features:
    dummies = pd.get_dummies(data[col], prefix=col) ------ 명목형 데이터는 판다스의 get_ dummies() 메서드를 사용하여 바이너리로 변환
    data = pd.concat([data, dummies], axis=1)
    data.drop(col, axis=1, inplace=True)
data.head()

코드를 실행하면 다음과 같이 연속형 데이터와 명목형 데이터로 분류됩니다.

▲ 그림 3-33 예제 데이터를 연속형 데이터와 명목형 데이터로 분류

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.