더북(TheBook)

■ 지도 학습 사례 살펴보기 1: 분류

먼저 지도 학습은 분류(classification)에 사용됩니다. 지도 학습은 정답이 있는 데이터, 즉 레이블이 있는 데이터를 사용하여 인공지능 학습을 진행합니다. 그러므로 레이블 개수에 따라 분류할 수 있습니다. 그중 두 가지를 구분할 수 있는 분류(예를 들어 스팸 메일인지와 일반 메일인지를 구별하는 분류, 병원에서 환자의 폐 사진을 찍은 CT 사진에서 암이 보이는지 아닌지를 분류)를 이진 분류(binary classification)라고 합니다. 다양한 새의 종류나 붓꽃(Iris)의 종류, 지폐처럼 여러 개 중 하나를 구별해 내는 분류일 때는 다중 분류(multiclass classification)라고 합니다.

이와 같은 분류는 데이터의 정답 개수에 따라 그 종류가 결정됩니다. 즉, 어떤 데이터에서 여러 성질을 두 가지 답으로 나타낼 수 있다면, 그 데이터를 사용하여 이진 분류를 할 수 있습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.