환경 변수 값을 바꾸어 가면서 실행해 보는 것도 학습에 좋은 방법입니다.
데이터셋을 불러와 훈련과 테스트 데이터셋으로 분리합니다.
코드 3-7 iris 데이터를 준비하고 훈련과 테스트 데이터셋으로 분리
iris = datasets.load_iris() ------ 사이킷런에서 제공하는 iris 데이터 호출
X_train, X_test, y_train, y_test =
model_selection.train_test_split(iris.data,
iris.target,
test_size=0.6,
random_state=42) ------ 사이킷런의 model_selection 패키지에서 제공하는 train_test_split 메서드를 활용하여 훈련과 테스트 데이터셋으로 분리
먼저 사이킷런으로 SVM 모델을 생성 및 훈련시킨 후 테스트 데이터셋을 이용한 예측을 수행합니다.
코드 3-8 SVM 모델에 대한 정확도
svm = svm.SVC(kernel='linear', C=1.0, gamma=0.5) ------ ①
svm.fit(X_train, y_train) ------ 훈련 데이터를 사용하여 SVM 분류기를 훈련
predictions = svm.predict(x_test) ------ 훈련된 모델을 사용하여 테스트 데이터에서 예측
score = metrics.accuracy_score(y_test, predictions)
print('정확도: {0:f}'.format(score)) ------ 테스트 데이터 (예측) 정확도 측정