더북(TheBook)

▲ 그림 7-3 데이터 샘플(6개의 속성)

그림 7-3을 보면 target 값과 6개의 추가 특성은 [0, 1]의 실수 범위를 가집니다. 0으로 갈수록 깨끗한 글이고, 1에 가까울수록 악성의 정도가 심한 글입니다. 실제 검증 셋을 가지고 평가(Evaluation)할 때 target 값은 target >= 0.5를 기준으로 1, 그 외의 값은 0으로 변경한 후 계산됩니다.

▲ 그림 7-4 데이터 샘플(Identity 타깃)

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.