10장 분류 알고리즘 II: 기계 학습 알고리즘
이 장에서는 9장에서 탐색, 전처리, 평가 메트릭 결정, 교차 검증을 마친
데이터에 대해 기계 학습 모델을 적용하는 방법을 살펴본다. 이 장에서
살펴볼 알고리즘은 기계 학습에서 기본이 되는 로지스틱 회귀 모델, 의사
결정 나무, 신경망, 서포트 벡터 머신이다. 이들 모델을 살펴본 뒤에는 기계
학습에서 부딪치는 중요 문제 중 하나인 클래스 불균형의 해결 방법을
설명한다.
마지막으로 분류 알고리즘을 총 정리하기 위해 텍스트 마이닝 패키지 tm과
기계 학습 알고리즘을 사용해 로이터 기사에서 원유(crude oil)에 대한
기사와 기업 간 인수 합병에 대한 기사를 분류하는 예를 살펴본다.
01 로지스틱 회귀 모델
03 의사 결정 나무
04 신경망
05 서포트 벡터 머신
06 클래스 불균형
07 문서 분류
08 caret 패키지