더북(TheBook)

shape로 학습 세트에서 평균보다 투표수가 많은 건의 개수를 확인해 보자.

df_test.loc[df_test['votes_pos_neg'] == 1].shape

실행 결과

(671, 11)

 

◼︎ 시험 데이터 세트 만들기

split_count를 기준(아래에서 30% 개수)으로 시험 데이터를 사용한다.

df_test = df[split_count:].copy()
df_test.shape

실행 결과

(1533, 11)

 

shape로 시험 세트에서 평균보다 투표수가 많은 건의 개수를 확인해 보자.

df_test.loc[df_test['votes_pos_neg'] == 1].shape

실행 결과

(273, 11)
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.