더북(TheBook)

결정 트리 분류 모델의 강점과 약점

이 절에서는 결정 트리 분류 알고리즘의 강점과 약점에 대해 알아보겠습니다.

 

강점

다음은 결정 트리 분류 모델의 강점입니다.

결정 트리가 생성한 규칙들은 사람이 이해하기 쉽습니다. 이러한 특징을 가진 모델들을 화이트박스 모델(whitebox model)이라고 합니다. 모델이 출력한 판단 결과를 더 자세히 이해하거나 근거에 대한 설명이 필요하다면 화이트박스 모델로 문제를 풀어야 합니다. 사회 문제를 다루거나 편향을 피하려는 경우에는 화이트박스 모델의 투명성이 필수입니다. 예를 들어, 정부나 보험 업계의 요구조건에는 화이트박스 모델이 포함되는 경우가 많습니다.

결정 트리 분류 모델은 이산적인(discrete) 문제 공간에서 정보를 추출하기 위해 고안됐습니다. 즉, 결정 트리 알고리즘은 카테고리형 변수가 많은 문제에 잘 동작합니다.

 

약점

다음은 결정 트리 분류 모델의 약점입니다.

결정 트리 분류 알고리즘이 생성하는 트리가 너무 깊어지면, 생성된 규칙들이 지나치게 상세해지면서 모델이 과적합되기 쉽습니다. 결정 트리를 사용할 때는 과적합의 위험을 항상 경계해야 합니다. 이를 방지하기 위해 트리의 브랜치를 솎아내야 합니다.

결정 트리가 만들어내는 규칙들은 비선형성을 표현하지 못합니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.