모델에 대한 예측을 테스트 데이터셋 일부를 사용해서 진행해 봅시다.
코드 3-19 일부 데이터를 사용한 모델 예측
logisticRegr.predict(x_test[0].reshape(1,-1)) ------ 새로운 이미지(테스트 데이터)에 대한 예측 결과를 넘파이 배열로 출력
logisticRegr.predict(x_test[0:10]) ------ 이미지 열 개에 대한 예측을 한 번에 배열로 출력
열 개의 이미지 데이터를 사용한 로지스틱 회귀 모델에 대한 예측 결과는 다음과 같이 출력됩니다.
array([2, 8, 2, 6, 6, 7, 1, 9, 8, 5])
모델 성능을 측정하겠습니다. 모델 성능을 측정하는 방법으로는 혼동 행렬(정확도, 정밀도, 재현율), F1-스코어, ROC 커브 등이 있습니다. 먼저 정확도에 대한 성능을 확인해 보겠습니다. 정확도는 테스트 데이터셋 전체를 이용하여 진행합니다.
코드 3-20 전체 데이터를 사용한 모델 예측
predictions = logisticRegr.predict(x_test) ------ 전체 데이터셋에 대한 예측
score = logisticRegr.score(x_test, y_test) ------ 스코어(score) 메서드를 사용한 성능 측정
print(score)