더북(TheBook)

분류 문제에 결정 트리 분류 알고리즘 적용하기

고객이 제품을 구매할지 예측하는 문제를 결정 트리 분류 알고리즘으로 풀어봅시다.

1. 먼저, 결정 트리 분류 모델 인스턴스를 생성하고 훈련 데이터로 모델을 훈련합니다.

▼ mydecisiontree2.ipynb

[in :]

classifier = sklearn.tree.DecisionTreeClassifier(criterion = 'entropy', random_state = 100, max_depth=2) 
classifier.fit(X_train, y_train)

2. 훈련된 모델을 이용해 테스트 데이터의 라벨을 예측합니다. 모델의 성능을 요약하는 혼동 행렬을 생성합니다.

[in :]

import sklearn.metrics as metrics
y_pred = classifier.predict(X_test)
cm = metrics.confusion_matrix(y_test, y_pred) 
cm

혼동 행렬은 다음과 같습니다.

[out:]

array([[64,  4],
       [ 2, 30]], dtype=int64)
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.