회귀모형에 대한 결과를 해석하려면 다음의 결괏값을 살펴봐야 한다.
>>> print(regr.coef_)
[2.6092233]
계수는 2.6092233으로 즉, 주당 공부 시간이 한 시간 늘 때마다 성적은 2.6점 정도 상승하는 것을 의미한다. 현재 자료의 y와 직선에 의해 계산된 y로 결정계수를 구해보자. 대략 0.94의 값이 나오니(1에 가까울수록 좋다) 주어진 데이터에 대해 위 직선식은 잘 작동하는 것을 볼 수 있다.
>>> from sklearn.metrics import r2_score >>> y_pred = regr.predict(x) >>> r2_score(y, y_pred) 0.9415099463643153
이제 구한 직선식을 플롯에 같이 표현해보자.
>>> plt.scatter(x, y, color='black') >>> plt.plot(x, y_pred, color='blue', linewidth=3) >>> plt.xlabel("study") >>> plt.ylabel("score") >>> plt.show()
이와 같이 선형 회귀모형의 결과를 해석할 때는 각 변수 X가 변수 Y에 미치는 영향의 크기, 그리고 모형의 적합도에 대한 값을 먼저 확인하도록 하자.