더북(TheBook)

3.4 평가: 시험지 채점

지금까지는 평가를 할 때 시험 답안을 외우지 않는 것에 대해 이야기했습니다. 그래서 우리는 한 묶음의 질문으로 훈련하고 다른 한 묶음으로 시험을 봅니다. 시험을 보고 나서 어떻게 점수나 등급을 측정할까요? 나중에 더 자세하게 알아보겠지만 일단은 간단하게 ‘답변이 맞았는지’ 확인하겠습니다. 답변이 참일 때 우리가 참으로 예측했다면 점수를 얻게 됩니다! 답변이 거짓인데 참으로 예측했다면 점수를 얻지 못합니다. 각 정답은 1점으로 계산됩니다. 각 오답은 0점으로 계산됩니다. 각 질문은 0점이나 1점으로 동일하게 계산됩니다. 최종적으로 정답이 전체 몇 퍼센트인지 알고 싶으므로, 얻은 점수를 모두 더한 후 전체 문제의 숫자로 나눕니다. 이러한 형태의 평가를 정확도(accuracy)라고 하며, 그 수식은 입니다. 이것은 다중 택일 시험 문제를 채점하는 것과 매우 유사합니다.

자 그러면, 앞서 이야기한 아이디어를 짧은 코드로 써 봅시다. 네 개의 참-거짓 문제로 구성된 짧은 시험을 치겠습니다. 어떤 가상의 학생이 궁지에 몰린 자포자기 심정으로 모든 문제에 참으로 답을 써냈습니다. 그러면 어떻게 될까요?

 

In [6]:

answer_key = np.array([True, True, False, True])
student_answers = np.array([True, True, True, True]) # 자포자기한 학생
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.