더북(TheBook)

데이터프레임에서 데이터셋을 가져와 Xy를 생성합니다.

코드 8-4 데이터셋 분류

X = df[['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']]
X = np.asarray(X) ------ ‘sepal length (cm)’, ‘sepal width (cm)’, ‘petal length (cm)’, ‘petal width (cm)’ 열을 배열로 변환하여 X 변수에 저장
y = df[['label_setosa', 'label_versicolor', 'label_virginica']]
y = np.asarray(y) ------ ‘label_setosa’, ‘label_versicolor’, ‘label_virginica’ 열을 배열로 변환하여 y 변수에 저장

앞서 생성했던 Xy를 사용하여 훈련과 검증 데이터셋으로 분리합니다.

코드 8-5 데이터셋 분리

X_train, X_test, y_train, y_test = train_test_split(
    X,
    y,
    test_size=0.20
) ------ 훈련과 검증 데이터를 8:2로 분리
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.