분류 문제에 결정 트리 분류 알고리즘 적용하기
고객이 제품을 구매할지 예측하는 문제를 결정 트리 분류 알고리즘으로 풀어봅시다.
1. 먼저, 결정 트리 분류 모델 인스턴스를 생성하고 훈련 데이터로 모델을 훈련합니다.
▼ mydecisiontree2.ipynb
[in :]
classifier = sklearn.tree.DecisionTreeClassifier(criterion = 'entropy', random_state = 100, max_depth=2)
classifier.fit(X_train, y_train)
2. 훈련된 모델을 이용해 테스트 데이터의 라벨을 예측합니다. 모델의 성능을 요약하는 혼동 행렬을 생성합니다.
[in :]
import sklearn.metrics as metrics
y_pred = classifier.predict(X_test)
cm = metrics.confusion_matrix(y_test, y_pred)
cm
혼동 행렬은 다음과 같습니다.
[out:]
array([[64, 4],
[ 2, 30]], dtype=int64)