① 사이킷런은 정밀도, 재현율, F1-스코어를 구하기 위해 classification_report를 제공합니다. 이것은 각각의 클래스를 긍정(positive) 클래스로 간주했을 때의 정밀도, 재현율, F1-스코어를 각각 구하고 그 평균값으로 전체 모델 성능을 평가합니다. 이때 사용되는 파라미터는 다음과 같습니다.
ⓐ 첫 번째 파라미터: 레이블(정답)
ⓑ 두 번째 파라미터: 모델이 예측한 값
ⓒ labels: 출력에 대한 순서 변경
예를 들어 confusion_matrix의 결과가 다음과 같다고 가정해 봅시다.
array([[1, 2], [3, 4]])
이때 labels=[1,0]을 지정하면 결과가 다음과 같이 변경됩니다.
array([[3, 4], [1, 2]])
② heatmap은 말 그대로 heat와 map이 합쳐진 것과 같습니다. 즉, 데이터의 배열을 색상으로 표현하고자 할 때 사용합니다. 이때 사용되는 파라미터는 다음과 같습니다.
ⓐ 첫 번째 파라미터: heatmap으로 표현할 데이터셋
ⓑ annot: heatmap의 각 셀에 숫자를 입력
ⓒ ax: 플롯에 대한 축
ⓓ cmap: heatmap의 색상
ⓔ fmt: annot에 숫자를 입력하겠다고 했고, 그 숫자의 형태를 정수로 표현하겠다는 의미입니다.