더북(TheBook)

3.5 요약

분류 작업은 이산적인 예측을 만든다는 점에서 회귀 작업과 다릅니다.

분류는 이진 분류와 다중 분류 두 종류가 있습니다. 이진 분류는 입력에 대해 두 개의 가능한 클래스가 있고, 다중 분류는 세 개 이상의 클래스가 있습니다.

이진 분류는 일반적으로 모든 입력 샘플 중에서 양성이라 부르는 어떤 종류의 이벤트나 객체를 감지하는 것으로 볼 수 있습니다. 이런 점을 볼 때 정확도 외에 정밀도, 재현율, FPR을 사용해 이진 분류기의 다양한 측면을 정량화할 수 있습니다.

일반적으로 이진 분류 작업에는 모든 양성 샘플을 찾아내는 것과 거짓 양성(잘못된 경보)을 최소화하는 것 사이에 균형점이 있습니다. ROC 곡선과 AUC 지표는 이 관계를 시각화하고 정량화하는 데 도움이 됩니다.

이진 분류를 위한 신경망은 마지막 (출력) 층에 시그모이드 활성화 함수를 사용하고 훈련하는 동안 손실 함수로 이진 크로스 엔트로피를 사용해야 합니다.

다중 분류를 위한 신경망을 만들기 위해 일반적으로 출력 타깃을 원-핫 인코딩으로 표현합니다. 신경망은 출력층에 소프트맥스 활성화 함수를 사용하고 범주형 크로스 엔트로피 손실 함수를 사용해 훈련됩니다.

다중 분류에서 오차 행렬은 모델이 저지른 실수에 대해 정확도보다 자세한 정보를 제공합니다.

표 3-6에는 지금까지 본 가장 일반적인 머신 러닝 문제(회귀, 이진 분류, 다중 분류)를 위해 권장되는 방법들이 요약되어 있습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.