더북(TheBook)

7.3.3 예측변수 설정

예측변수는 독립변수를 가리키며, 목표변수 값을 결정하는 데 사용된다. 시가에서 종가를 뺀 'Open-Close'와 고가에서 저가를 뺀 'High-Low'를 예측변수로 사용한다. ‘시가-종가’는 거래일을 대표하는 변동폭을, ‘고가-저가’는 거래일 하루 중 최대 변동폭을 의미하기도 한다.

시가(df.Open)에서 종가(df.Close)를 빼고(df.Open - df.Close) 데이터프레임 df'Open-Close'라는 새 컬럼을 만들어 저장한다. 고가와 저가도 마찬가지로 계산하고 'High-Low'라는 새 컬럼을 만들어 저장한다. 그리고 예측변수로서 X에 새로 만든 두 개의 컬럼 'Open-Close''High-Low'를 저장한다.

df = df.dropna( )
df[ 'Open-Close' ] = df.Open - df.Close
df[ 'High-Low' ] = df.High - df.Low
X = df[ [ 'Open-Close', 'High-Low'] ]
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.