더북(TheBook)

실행 결과

Accuracy: 66.15 %
Standard Deviation: 5.05 %

from sklearn.tree import DecisionTreeClassifier 코드를 통해 사이킷런 라이브러리의 결정 트리 알고리즘을 가져왔습니다. 를 통해 결정 트리 알고리즘을 분류기로 지정했고, 을 통해 이를 실행했습니다. 학습 결과에 테스트셋을 적용한 결과는 를 통해 y_pred에 저장됩니다.

열 개의 서브셋으로 나누어 학습과 테스트를 각각 실시했고 mean()을 통해 정확도를, std()를 통해 표준편차를 구했습니다.

 

TIP

계층별 교차 검증(StratifiedKFold)은 교차 검증을 위한 데이터셋을 만들 때 클래스의 비율(당뇨병 발병 여부)을 맞추어 줍니다. 추출되는 데이터셋이 매번 다르므로 결괏값도 실행할 때마다 조금씩 차이가 납니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.