5 가우시안 나이브 베이즈
가우시안 나이브 베이즈( gaussian naïve bayes)는 속성이 연속형 변수일 때, 베이즈 정리를 기반으로 각 범주에 속할 확률을 계산하는 방법입니다. 키를 측정한 데이터를 보고 남성인지 여성인지를 예측하는 문제가 있다고 합시다. 남성의 키와 여성의 키는 자체 평균과 표준편차 값이 있으므로 다음 그림과 같이 분포될 것입니다. 이때 목표 데이터가 각 범주에 속할 확률을 계산하고, 가장 높은 확률을 가지는 범주로 데이터를 분류합니다.
앞서 준비한 데이터셋에 가우시안 나이브 베이즈 분류기를 적용하면 다음과 같습니다.