더북(TheBook)

3 평균을 기준으로 투표수 예측하기

 

기본값을 0으로 설정한 후 평균 투표수를 구하고 투표수가 평균을 넘으면 1로 표기할 것이다.

df['votes_pos_neg'] = 0
 
votes_mean = df['votes'].mean()
votes_mean

실행 결과

5674.709140732041

 

평균은 5,674다. 이제 투표수가 평균을 넘는 데이터만 1로 다시 설정한다.

df['votes_pos_neg'] = (df['votes'] > votes_mean) == 1

변경한 후에 데이터 타입을 확인해 보면 논리형(bool)으로 되어 있다.

df['votes_pos_neg'].dtypes

실행 결과

dtype('bool')
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.