더북(TheBook)

이 모델은 80%에 가까운 정확도를 달성했습니다. 균형 잡힌 이진 분류 문제에서 완전히 무작위로 분류하면 50%의 정확도를 달성합니다. 하지만 이 문제는 46개의 클래스가 있고 클래스 비율이 같지 않습니다. 랜덤한 분류기를 사용해서 예측하면 정확도가 얼마나 나올까요? 간단한 코드로 직접 확인해 보겠습니다.

>>> import copy
>>> test_labels_copy = copy.copy(test_labels)
>>> np.random.shuffle(test_labels_copy)
>>> hits_array = np.array(test_labels) == np.array(test_labels_copy)
>>> hist_array.mean()
0.18655387355298308

여기에서 볼 수 있듯이 랜덤한 분류기는 약 19%의 분류 정확도를 달성합니다. 따라서 앞서 확인한 모델의 결과는 꽤 좋은 것 같습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.