더북(TheBook)

환경 변수 값을 바꾸어 가면서 실행해 보는 것도 학습에 좋은 방법입니다.

데이터셋을 불러와 훈련과 테스트 데이터셋으로 분리합니다.

코드 3-7 iris 데이터를 준비하고 훈련과 테스트 데이터셋으로 분리

iris = datasets.load_iris() ------ 사이킷런에서 제공하는 iris 데이터 호출
X_train, X_test, y_train, y_test =
model_selection.train_test_split(iris.data,
                                 iris.target,
                                 test_size=0.6,
                                 random_state=42) ------ 사이킷런의 model_selection 패키지에서 제공하는 train_test_split 메서드를 활용하여 훈련과 테스트 데이터셋으로 분리

먼저 사이킷런으로 SVM 모델을 생성 및 훈련시킨 후 테스트 데이터셋을 이용한 예측을 수행합니다.

코드 3-8 SVM 모델에 대한 정확도

svm = svm.SVC(kernel='linear', C=1.0, gamma=0.5)  ------ ①
svm.fit(X_train, y_train)  ------ 훈련 데이터를 사용하여 SVM 분류기를 훈련
predictions = svm.predict(x_test)  ------ 훈련된 모델을 사용하여 테스트 데이터에서 예측
score = metrics.accuracy_score(y_test, predictions)
print('정확도: {0:f}'.format(score)) ------ 테스트 데이터 (예측) 정확도 측정
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.