코드 7-1 ARIMA( ) 함수를 호출하여 sales 데이터셋에 대한 예측
from pandas import read_csv ------ 파이썬 판다스 라이브러리의 read_csv() 메서드를 사용해서 외부 TEXT 파일, CSV 파일을 불러와서 DataFrame으로 저장
from pandas import datetime
from pandas import DataFrame
from statsmodels.tsa.arima_model import ARIMA
from matplotlib import pyplot
def parser(x): ------ 시간을 표현하는 함수 정의
return datetime.strptime('199'+x, '%Y-%m') ------ strptime()은 날짜와 시간 정보를 문자열로 바꾸어 주는 메서드
series = read_csv('../chap7/data/sales.csv', header=0, parse_dates=[0], index_col=0, squeeze=True, date_parser=parser) ------ 자전거 매출에 대한 CSV 데이터 호출
model = ARIMA(series, order=(5,1,0)) ------ ARIMA( ) 함수 호출
model_fit = model.fit(disp=0) ------ 모형을 적용할 때 많은 디버그 정보가 제공되는데 disp 인수를 0으로 설정하여 이 기능을 비활성화
print(model_fit.summary()) ------ 모델에 대한 정보 표시
residuals = DataFrame(model_fit.resid) ------ DataFrame에 모델에 대한 오차 정보를 residuals라는 변수에 저장
residuals.plot() ------ residuals 정보를 시각적으로 표현
pyplot.show()
residuals.plot(kind='kde')
pyplot.show()
print(residuals.describe())