더북(TheBook)

3.2 출력층의 비선형성: 분류를 위한 모델

지금까지 보았던 두 예제는 모두 (다운로드 시간이나 평균 주택 가격 같은) 수치를 예측하는 회귀 작업이었습니다. 하지만 머신 러닝에 있는 또 다른 일반적인 작업은 분류입니다. 분류 작업 중 ‘예/아니요’ 질문에 대한 답을 타깃으로 삼는 것이 이진 분류(binary classification)입니다. 기술 분야에는 이런 종류의 문제가 매우 많습니다.

이메일이 스팸인지 아닌지 여부

신용 카드 거래가 합법적인지 사기인지 여부

1초짜리 음성 샘플에 특정 단어가 포함되어 있는지 여부

두 개의 지문 이미지가 서로 동일한지(같은 사람의 손가락 지문인지) 여부

또 다른 종류의 분류 문제는 다중 분류(multiclass classification)입니다. 다중 분류의 예는 다음과 같습니다.

뉴스 기사가 스포츠, 날씨, 게임, 정치 또는 다른 일반 주제에 관한 내용 중 어느 것인지 결정하기

사진이 고양이, 강아지, 삽, … 중에서 어느 것인지 결정하기

전자 스타일러스 펜에서 획 데이터가 주어지면 손 글씨 문자가 어떤 것인지 결정하기

머신 러닝이 아타리(Atari) 같은 간단한 비디오 게임을 플레이할 때 현재 게임 상태에서 게임 캐릭터가 다음에 수행할 수 있는 네 개의 방향(위, 아래, 왼쪽, 오른쪽) 중 하나를 결정하기

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.