3 평균을 기준으로 투표수 예측하기
기본값을 0으로 설정한 후 평균 투표수를 구하고 투표수가 평균을 넘으면 1로 표기할 것이다.
df['votes_pos_neg'] = 0 votes_mean = df['votes'].mean() votes_mean
실행 결과
5674.709140732041
평균은 5,674다. 이제 투표수가 평균을 넘는 데이터만 1로 다시 설정한다.
df['votes_pos_neg'] = (df['votes'] > votes_mean) == 1
변경한 후에 데이터 타입을 확인해 보면 논리형(bool)으로 되어 있다.
df['votes_pos_neg'].dtypes
실행 결과
dtype('bool')