더북(TheBook)

회귀모형에 대한 결과를 해석하려면 다음의 결괏값을 살펴봐야 한다.

>>> print(regr.coef_)
[2.6092233]

계수는 2.6092233으로 즉, 주당 공부 시간이 한 시간 늘 때마다 성적은 2.6점 정도 상승하는 것을 의미한다. 현재 자료의 y와 직선에 의해 계산된 y로 결정계수를 구해보자. 대략 0.94의 값이 나오니(1에 가까울수록 좋다) 주어진 데이터에 대해 위 직선식은 잘 작동하는 것을 볼 수 있다.

>>> from sklearn.metrics import r2_score
>>> y_pred = regr.predict(x)
>>> r2_score(y, y_pred)
0.9415099463643153

이제 구한 직선식을 플롯에 같이 표현해보자.

>>> plt.scatter(x, y, color='black')
>>> plt.plot(x, y_pred, color='blue', linewidth=3)
>>> plt.xlabel("study")
>>> plt.ylabel("score")
>>> plt.show()

 

이와 같이 선형 회귀모형의 결과를 해석할 때는 각 변수 X가 변수 Y에 미치는 영향의 크기, 그리고 모형의 적합도에 대한 값을 먼저 확인하도록 하자.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.