3.2 출력층의 비선형성: 분류를 위한 모델
지금까지 보았던 두 예제는 모두 (다운로드 시간이나 평균 주택 가격 같은) 수치를 예측하는 회귀 작업이었습니다. 하지만 머신 러닝에 있는 또 다른 일반적인 작업은 분류입니다. 분류 작업 중 ‘예/아니요’ 질문에 대한 답을 타깃으로 삼는 것이 이진 분류(binary classification)입니다. 기술 분야에는 이런 종류의 문제가 매우 많습니다.
• 이메일이 스팸인지 아닌지 여부
• 신용 카드 거래가 합법적인지 사기인지 여부
• 1초짜리 음성 샘플에 특정 단어가 포함되어 있는지 여부
• 두 개의 지문 이미지가 서로 동일한지(같은 사람의 손가락 지문인지) 여부
또 다른 종류의 분류 문제는 다중 분류(multiclass classification)입니다. 다중 분류의 예는 다음과 같습니다.
• 뉴스 기사가 스포츠, 날씨, 게임, 정치 또는 다른 일반 주제에 관한 내용 중 어느 것인지 결정하기
• 사진이 고양이, 강아지, 삽, … 중에서 어느 것인지 결정하기
• 전자 스타일러스 펜에서 획 데이터가 주어지면 손 글씨 문자가 어떤 것인지 결정하기
• 머신 러닝이 아타리(Atari) 같은 간단한 비디오 게임을 플레이할 때 현재 게임 상태에서 게임 캐릭터가 다음에 수행할 수 있는 네 개의 방향(위, 아래, 왼쪽, 오른쪽) 중 하나를 결정하기