데이터프레임에서 데이터셋을 가져와 X와 y를 생성합니다.
코드 8-4 데이터셋 분류
X = df[['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']]
X = np.asarray(X) ------ ‘sepal length (cm)’, ‘sepal width (cm)’, ‘petal length (cm)’, ‘petal width (cm)’ 열을 배열로 변환하여 X 변수에 저장
y = df[['label_setosa', 'label_versicolor', 'label_virginica']]
y = np.asarray(y) ------ ‘label_setosa’, ‘label_versicolor’, ‘label_virginica’ 열을 배열로 변환하여 y 변수에 저장
앞서 생성했던 X와 y를 사용하여 훈련과 검증 데이터셋으로 분리합니다.
코드 8-5 데이터셋 분리
X_train, X_test, y_train, y_test = train_test_split(
X,
y,
test_size=0.20
) ------ 훈련과 검증 데이터를 8:2로 분리