회귀 문제에 선형 회귀 알고리즘 적용하기
훈련 데이터로 선형 회귀 모델을 훈련해 봅시다.
1. 선형 회귀 패키지를 불러옵니다.
▼ myLinearRegression.ipynb
[in :]
from sklearn.linear_model import LinearRegression
2. 선형 회귀 모델 인스턴스를 생성하고 훈련 데이터로 모델을 훈련합니다.
[in :]
regressor = LinearRegression()
regressor.fit(X_train, y_train)
3. 테스트 데이터로 예측을 수행합니다.
[in :]
y_pred = regressor.predict(X_test)
from sklearn.metrics import mean_squared_error
from math import sqrt
sqrt(mean_squared_error(y_test, y_pred))
4. 이 코드를 실행하면 다음과 같은 결과를 얻습니다.
[out:]
4.36214129677179
이전 절에서 설명했던 것처럼, RMSE는 오차의 표준 편차입니다. 이는 곧 예측 결과의 68.2%가 타깃 변수의 값으로부터 ±4.36 이내에 분포한다는 의미입니다.