x와 y가 직선적 관계인지 알아보기 위해 플롯을 그려보자.
>>> %matplotlib inline >>> from matplotlib import pyplot as plt >>> plt.scatter(x, y) >>> plt.xlabel("study") >>> plt.ylabel("score") >>> plt.show()
그리고 이 데이터를 잘 나타내는 직선을 찾아보자. 이때 성적은 공부 시간에 영향을 받는다고 가정하자. 이때 공부 시간을 X 변수, 성적은 Y 변수가 된다. 그리고 이 둘의 관계를 직선식을 통해 설명하고자 한다.
>>> from sklearn import linear_model >>> regr = linear_model.LinearRegression() >>> regr.fit(x, y) LinearRegression(copy_X=True, fit_intercept=True, n_jobs=None, normalize=False)