21 역주 sklearn.metrics 모듈의 classification_report 함수는 정밀도, 재현율, F1- 점수를 한 번에 계산하여 출력해 줍니다. 이 함수를 다중 분류 모델에 적용하면 가중치가 적용된 마크로 평균을 계산합니다. 사이킷런 0.20 버전부터는 마이크로, 마크로, 가중치 마크로 값을 모두 계산하여 반환합니다. precision_score, recall_score 등의 함수에 average 매개변수 기본값은 이진 분류일 경우에 해당하는 'binary'입니다. 다중 분류에서 마이크로, 마크로, 가중치 마크로 평균을 사용하려면 각각 'micro', 'macro', 'weighted'로 지정합니다.
22 역주 class_weight 매개변수에 클래스 레이블과 가중치 값을 쌍으로 갖는 딕셔너리를 직접 주입할 수도 있습니다. 'balanced'로 지정하면 클래스별 평균 샘플 개수(전체 샘플 개수/클래스 개수)를 각 레이블의 샘플 개수로 나누어 score 점수를 가중 평균합니다.
23 SMOTE: Synthetic Minority Over-sampling Technique, Journal of Artificial Intelligence Research, 16: 321-357, 2002
https://www.jair.org/index.php/jair/article/view/10302