이제 전체 훈련 데이터셋과 테스트 데이터셋의 RMSE를 계산해 보자.
from sklearn.metrics import mean_squared_error train_pred = model.predict(X_train) train_rmse = np.sqrt(mean_squared_error(y_train, train_pred)) test_pred = model.predict(X_test) test_rmse = np.sqrt(mean_squared_error(y_test, test_pred)) print("Train RMSE: {:0.2f}".format(train_rmse)) print("Test RMSE: {:0.2f}".format(test_rmse))
▲ 그림 3-23 RMSE 계산 결과
테스트 RMSE가 3.55라는 것은 결국 예제 모델이 평균 3.5달러의 오차로 택시 요금을 예측할 수 있다는 뜻이다.