더북(TheBook)

두 개 이상의 클래스 레이블을 가진 경우가 많습니다. 지도 학습 알고리즘으로 학습한 예측 모델은 훈련 데이터셋에 있는 여러 클래스 레이블 중 하나를 새로운 샘플 또는 새로운 데이터 포인트에 할당할 수 있습니다.

이런 다중 분류(multiclass classification)의 전형적인 예는 손으로 쓴 글자 인식입니다. 여기에서 글자(“A”, “B”, “C” 등)는 예측하려는 대상이며 순서가 없는 범주나 클래스 레이블로 표현됩니다. 알파벳 각 글자를 손으로 쓴 이미지 샘플을 모아서 훈련 데이터셋을 구성합니다. 새로운 글자를 입력으로 제공하면 예측 모델이 일정한 정확도로 알파벳 글자를 예측할 것입니다. 하지만 0에서 9까지 숫자가 훈련 데이터셋에 없다면 이 머신 러닝 시스템은 숫자를 인식하지 못할 것입니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.