3.5 요약
• 분류 작업은 이산적인 예측을 만든다는 점에서 회귀 작업과 다릅니다.
• 분류는 이진 분류와 다중 분류 두 종류가 있습니다. 이진 분류는 입력에 대해 두 개의 가능한 클래스가 있고, 다중 분류는 세 개 이상의 클래스가 있습니다.
• 이진 분류는 일반적으로 모든 입력 샘플 중에서 양성이라 부르는 어떤 종류의 이벤트나 객체를 감지하는 것으로 볼 수 있습니다. 이런 점을 볼 때 정확도 외에 정밀도, 재현율, FPR을 사용해 이진 분류기의 다양한 측면을 정량화할 수 있습니다.
• 일반적으로 이진 분류 작업에는 모든 양성 샘플을 찾아내는 것과 거짓 양성(잘못된 경보)을 최소화하는 것 사이에 균형점이 있습니다. ROC 곡선과 AUC 지표는 이 관계를 시각화하고 정량화하는 데 도움이 됩니다.
• 이진 분류를 위한 신경망은 마지막 (출력) 층에 시그모이드 활성화 함수를 사용하고 훈련하는 동안 손실 함수로 이진 크로스 엔트로피를 사용해야 합니다.
• 다중 분류를 위한 신경망을 만들기 위해 일반적으로 출력 타깃을 원-핫 인코딩으로 표현합니다. 신경망은 출력층에 소프트맥스 활성화 함수를 사용하고 범주형 크로스 엔트로피 손실 함수를 사용해 훈련됩니다.
• 다중 분류에서 오차 행렬은 모델이 저지른 실수에 대해 정확도보다 자세한 정보를 제공합니다.
• 표 3-6에는 지금까지 본 가장 일반적인 머신 러닝 문제(회귀, 이진 분류, 다중 분류)를 위해 권장되는 방법들이 요약되어 있습니다.