더북(TheBook)

실행 결과

Accuracy: 75.88 %
Standard Deviation: 4.29 %

베이즈 정리란 조건부 확률을 계산하는 방법의 하나입니다. 이전의 경험과 현재의 정보를 근거로 확률을 구해 가는 방법이라고 할 수 있습니다. 예를 들어 어떤 사람의 키가 180cm 이상이라고 하면, 아마도 이 사람은 남자일 확률이 더 높겠지요. 베이즈 정리를 통해 데이터가 특정한 클래스에 속할 확률을 계산하는 것을 베이즈 분류라고 하며, 예측할 속성들이 상호 독립적일 때(예를 들어 A씨의 키와 B씨의 키는 서로 종속되지 않음) 이를 나이브 베이즈 분류라고 합니다. 여기에 해당 데이터가 연속적으로 분포하고 있을 경우, 가우시안 나이브 베이즈 분류를 사용하는 것입니다.

사이킷런의 sklearn.naive_bayes에서 GaussianNB() 분류기를 불러와 가우시안 나이브 베이즈 분류를 쉽게 적용할 수 있었습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.