더북(TheBook)

▲ 그림 7-6 정답 분포 그래프

그래프를 보면 1에 가까워질수록 수치가 감소합니다. 또한, 특정 값에서 타깃의 분포가 두드러진 양상을 보입니다. 추측해보면 댓글을 평가하는 과정에서 여러 방법으로 악성 점수를 매겼을 겁니다. 보통 설문지에서 어떤 질문에 대한 평가 점수를 매길 때 1~5 사이에서 선택하는 형태가 대부분이고, 그것이 0~1 사이로 정규화(Normalization) 작업을 거친다면 위와 같은 형태의 분포가 만들어질 것입니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.