shape로 학습 세트에서 평균보다 투표수가 많은 건의 개수를 확인해 보자.

    df_test.loc[df_test['votes_pos_neg'] == 1].shape

    실행 결과

    (671, 11)

     

    ◼︎ 시험 데이터 세트 만들기

    split_count를 기준(아래에서 30% 개수)으로 시험 데이터를 사용한다.

    df_test = df[split_count:].copy()
    df_test.shape

    실행 결과

    (1533, 11)

     

    shape로 시험 세트에서 평균보다 투표수가 많은 건의 개수를 확인해 보자.

    df_test.loc[df_test['votes_pos_neg'] == 1].shape

    실행 결과

    (273, 11)
    신간 소식 구독하기
    뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.