더북(TheBook)

① 사이킷런은 정밀도, 재현율, F1-스코어를 구하기 위해 classification_report를 제공합니다. 이것은 각각의 클래스를 긍정(positive) 클래스로 간주했을 때의 정밀도, 재현율, F1-스코어를 각각 구하고 그 평균값으로 전체 모델 성능을 평가합니다. 이때 사용되는 파라미터는 다음과 같습니다.

ⓐ 첫 번째 파라미터: 레이블(정답)

ⓑ 두 번째 파라미터: 모델이 예측한 값

labels: 출력에 대한 순서 변경

예를 들어 confusion_matrix의 결과가 다음과 같다고 가정해 봅시다.

array([[1, 2],
       [3, 4]])

이때 labels=[1,0]을 지정하면 결과가 다음과 같이 변경됩니다.

array([[3, 4],
       [1, 2]])

heatmap은 말 그대로 heat와 map이 합쳐진 것과 같습니다. 즉, 데이터의 배열을 색상으로 표현하고자 할 때 사용합니다. 이때 사용되는 파라미터는 다음과 같습니다.

ⓐ 첫 번째 파라미터: heatmap으로 표현할 데이터셋

annot: heatmap의 각 셀에 숫자를 입력

ax: 플롯에 대한 축

cmap: heatmap의 색상

fmt: annot에 숫자를 입력하겠다고 했고, 그 숫자의 형태를 정수로 표현하겠다는 의미입니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.