1장에서 언급한 머신 러닝 핵심 알고리즘들을 하나씩 살펴보겠습니다. 이 장에서는 간단히 핵심 원리만 이해하고 넘어갈 것입니다.1
3.1 지도 학습
지도 학습은 정답(레이블(label))을 컴퓨터에 미리 알려 주고 데이터를 학습시키는 방법입니다. 지도 학습에는 분류와 회귀가 있습니다. 분류(classification)는 주어진 데이터를 정해진 범주에 따라 분류하고, 회귀(regression)는 데이터들의 특성(feature)을 기준으로 연속된 값을 그래프로 표현하여 패턴이나 트렌드를 예측할 때 사용합니다.
분류와 회귀 차이는 다음 표와 같습니다.
▼ 표 3-1 분류와 회귀 차이
구분 |
분류 |
회귀 |
데이터 유형 |
이산형 데이터 |
연속형 데이터 |
결과 |
훈련 데이터의 레이블 중 하나를 예측 |
연속된 값을 예측 |
예시 |
학습 데이터를 A·B·C 그룹 중 하나로 매핑 예 스팸 메일 필터링 |
결괏값이 어떤 값이든 나올 수 있음 예 주가 분석 예측 |
다음 그림을 보면 분류와 회귀 차이를 좀 더 명확히 알 수 있습니다.
▲ 그림 3-1 분류와 회귀
지금부터 지도 학습의 알고리즘을 하나씩 살펴보겠습니다.