머신 러닝 교과서 with 파이썬, 사이킷런, 텐서플로(개정 3판): 3.6.1 정보 이득 최대화: 자원을 최대로 활용

부모 노드에서 데이터셋 D_p로 시작합니다. 이 데이터셋은 클래스 1이 40개의 샘플, 클래스 2가 40개의 샘플로 이루어져 있습니다. 이를 두 개의 데이터셋 D_left와 D_right로 나눕니다. 분류 오차를 분할 기준으로 사용했을 때 정보 이득은 시나리오 A·B가 동일합니다(IG_E = 0.25).