회귀모형에 대한 결과를 해석하려면 다음의 결괏값을 살펴봐야 한다.

    >>> print(regr.coef_)
    [2.6092233]

    계수는 2.6092233으로 즉, 주당 공부 시간이 한 시간 늘 때마다 성적은 2.6점 정도 상승하는 것을 의미한다. 현재 자료의 y와 직선에 의해 계산된 y로 결정계수를 구해보자. 대략 0.94의 값이 나오니(1에 가까울수록 좋다) 주어진 데이터에 대해 위 직선식은 잘 작동하는 것을 볼 수 있다.

    >>> from sklearn.metrics import r2_score
    >>> y_pred = regr.predict(x)
    >>> r2_score(y, y_pred)
    0.9415099463643153

    이제 구한 직선식을 플롯에 같이 표현해보자.

    >>> plt.scatter(x, y, color='black')
    >>> plt.plot(x, y_pred, color='blue', linewidth=3)
    >>> plt.xlabel("study")
    >>> plt.ylabel("score")
    >>> plt.show()

     

    이와 같이 선형 회귀모형의 결과를 해석할 때는 각 변수 X가 변수 Y에 미치는 영향의 크기, 그리고 모형의 적합도에 대한 값을 먼저 확인하도록 하자.

    신간 소식 구독하기
    뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.