더북(TheBook)

회귀 문제에 선형 회귀 알고리즘 적용하기

훈련 데이터로 선형 회귀 모델을 훈련해 봅시다.

1. 선형 회귀 패키지를 불러옵니다.

▼ myLinearRegression.ipynb

[in :]

from sklearn.linear_model import LinearRegression

2. 선형 회귀 모델 인스턴스를 생성하고 훈련 데이터로 모델을 훈련합니다.

[in :]

regressor = LinearRegression() 
regressor.fit(X_train, y_train)

3. 테스트 데이터로 예측을 수행합니다.

[in :]

y_pred = regressor.predict(X_test)
from sklearn.metrics import mean_squared_error 
from math import sqrt 
sqrt(mean_squared_error(y_test, y_pred))

4. 이 코드를 실행하면 다음과 같은 결과를 얻습니다.

[out:]

4.36214129677179

이전 절에서 설명했던 것처럼, RMSE는 오차의 표준 편차입니다. 이는 곧 예측 결과의 68.2%가 타깃 변수의 값으로부터 ±4.36 이내에 분포한다는 의미입니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.