더북(TheBook)

3.6.1 시간 관련 변수

앞서 3.4.2절에서 데이터 시각화로 확인했듯이 승차 수는 요일과 시간에 따라 크게 다르다. 다음 코드를 실행해 pickup_datetime 칼럼의 형식을 확인하자.

print(df.head()['pickup_datetime'])
104_1

▲ 그림 3-12 pickup_datetime 칼럼 형식

앞서 언급했듯이 신경망은 숫자형 특징 변수만 처리할 수 있으며, 이런 datetime 문자열은 사용할 수 없다. pickup_datetime 칼럼을 year, month, day, day_of_week, hour 칼럼으로 나누자.

df['year'] = df['pickup_datetime'].dt.year
df['month'] = df['pickup_datetime'].dt.month
df['day'] = df['pickup_datetime'].dt.day
df['day_of_week'] = df['pickup_datetime'].dt.dayofweek
df['hour'] = df['pickup_datetime'].dt.hour
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.