지금부터 이러한 지도 학습이 어디에 사용되는지 살펴보겠습니다.
■ 지도 학습 사례 살펴보기1 - 분류
먼저 지도 학습은 분류(classification)에 사용됩니다. 지도 학습은 정답이 있는 데이터, 즉 레이블이 있는 데이터를 사용하여 인공지능 학습을 진행합니다. 그러므로 레이블 개수에 따라 분류할 수 있습니다.
그중 두 가지를 구분할 수 있는 분류, 예를 들어 스팸 메일인지, 일반 메일인지를 구별하는 분류, 혹은 병원에서 환자의 폐 사진을 찍은 CT 사진에서 암이 보이는지 아닌지 구별하는 분류를 이진 분류(binary classification)라고 합니다.
그리고 두 가지가 아닌 경우, 예를 들어 다양한 새의 종류나 붓꽃(Iris)의 종류 혹은 지폐의 종류와 같이 여러 개 중 하나를 구별해 내는 분류를 다중 분류(multiclass classification)라고 합니다.
그림 2-5 | 다중 분류의 예시
이와 같은 분류는 데이터의 정답 개수에 따라 그 종류가 결정됩니다. 즉, 어떤 데이터는 여러 성질들이 있는데 그 성질들이 2가지 답으로 나타난다면, 그 데이터를 사용하여 이진 분류를 할 수 있습니다. 그리고 여러 성질들이 3가지 이상 답으로 나타난다면 그 데이터로 지도 학습을 사용하여 다중 분류가 가능한 인공지능을 개발할 수 있지요.