더북(TheBook)

10장 분류 알고리즘 II: 기계 학습 알고리즘

이 장에서는 9장에서 탐색, 전처리, 평가 메트릭 결정, 교차 검증을 마친 데이터에 대해 기계 학습 모델을 적용하는 방법을 살펴본다. 이 장에서 살펴볼 알고리즘은 기계 학습에서 기본이 되는 로지스틱 회귀 모델, 의사 결정 나무, 신경망, 서포트 벡터 머신이다. 이들 모델을 살펴본 뒤에는 기계 학습에서 부딪치는 중요 문제 중 하나인 클래스 불균형의 해결 방법을 설명한다. 마지막으로 분류 알고리즘을 총 정리하기 위해 텍스트 마이닝 패키지 tm과 기계 학습 알고리즘을 사용해 로이터 기사에서 원유(crude oil)에 대한 기사와 기업 간 인수 합병에 대한 기사를 분류하는 예를 살펴본다.

01  로지스틱 회귀 모델

02  다항 로지스틱 회귀 분석

03  의사 결정 나무

04  신경망

05  서포트 벡터 머신

06  클래스 불균형

07  문서 분류

08  caret 패키지

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.