더북(TheBook)

이번 예제에서 사용할 데이터셋은 스타벅스 주가입니다. 데이터셋은 https://finance.yahoo.com/quote/sbux/history/를 이용합니다.

코드 7-41 데이터셋 가져오기

data = pd.read_csv('../chap07/data/SBUX.csv')
print(data.dtypes)

다음은 스타벅스 주가 데이터셋의 각 칼럼과 데이터 타입을 보여 줍니다.

Date          object
Open         float64
High         float64
Low          float64
Close        float64
Adj Close    float64
Volume         int64
dtype: object

데이터셋에 포함된 ‘Date’ 칼럼을 인덱스로 사용하도록 합니다. 이번 예제에서 사용할 데이터들은 숫자이기 때문에 임베딩이 필요하지 않지만 단어들로 구성된 데이터셋은 임베딩 과정을 거쳐야 합니다. 이때 날짜 칼럼은 임베딩 처리가 어려운 경우가 많은데, 날짜 칼럼을 인덱스로 처리하면 편리합니다.

코드 7-42 날짜 칼럼을 인덱스로 사용

data['date'] = pd.to_datetime(data['date'])
data.set_index('date', inplace=True) ------ ‘date’ 칼럼을 인덱스로 사용
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.