먼저 훈련에 필요한 데이터를 로드하고 필요한 라이브러리를 호출합니다.
코드 3-6 라이브러리 호출
from sklearn import svm
from sklearn import metrics
from sklearn import datasets
from sklearn import model_selection
import tensorflow as tf
import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '3' ------ ①
① TF_CPP_MIN_LOG_LEVEL이라는 환경 변수를 사용하여 로깅을 제어(기본값은 0으로 모든 로그가 표시되며, INFO 로그를 필터링하려면 1, WARNING 로그를 필터링하려면 2, ERROR 로그를 추가로 필터링하려면 3으로 설정)합니다.
환경 변수 값을 바꾸어 가면서 실행해 보는 것도 학습에 좋은 방법입니다.
데이터셋을 불러와 훈련과 검증 데이터셋으로 분리합니다.
코드 3-7 iris 데이터를 준비하고 훈련과 검증 데이터셋으로 분리
iris = datasets.load_iris() ------ 사이킷런에서 제공하는 iris 데이터 호출
X_train, X_test, y_train, y_test =
model_selection.train_test_split(iris.data, iris.target, test_size=0.6, random_state=42) ------ 사이킷런의 model_selection 패키지에서 제공하는 train_test_split 메서드를 활용하여 훈련셋(train set)과 검증셋(test set)으로 분리