이제 예측 결과와의 차이(pred_diff)를 비교해 보자. 이때는 판다스의 .value_counts()를 사용한다. value_counts()는 열에 있는 각 값에 대한 발생 횟수를 알려 준다.
pred_diff = df_test['pred_diff'].value_counts() pred_diff
실행 결과
0 1227 1 306 Name: pred_diff, dtype: int64
값을 print()하면 출력 결과를 더 직관적으로 확인할 수 있다.
print(f"전체 {y_pred.shape[0]}건의 데이터 중 {pred_diff[0]}건 예측")
실행 결과
전체 1533건의 데이터 중 1227건 예측