그래프의 기울기가 잘못되었을수록 빨간색 선의 거리의 합, 즉 오차의 합도 커집니다. 만일 기울기가 무한대로 커지면 오차도 무한대로 커지는 상관관계가 있는 것을 알 수 있습니다.
빨간색 선의 거리의 합을 실제로 계산해 보겠습니다. 거리는 입력 데이터에 나와 있는 y의 ‘실제 값’과 x를 y = 3x + 76 식에 대입해서 나오는 ‘예측 값’의 차이를 이용해 구할 수 있습니다. 예를 들어 2시간을 공부했을 때 실제 나온 점수(81점)와 그래프 y = 3x + 76 식에 x = 2를 대입했을 때(82점)의 차이가 곧 오차입니다. 따라서 오차를 구하는 방정식은 다음과 같습니다.
오차 = 실제 값 - 예측 값
이 식에 주어진 데이터를 대입해 얻을 수 있는 모든 오차 값을 정리하면 표 4-3과 같습니다.
표 4-3 | 주어진 데이터에서 오차 구하기
공부한 시간(x) |
2 |
4 |
6 |
8 |
성적(실제 값, y) |
81 |
93 |
91 |
97 |
예측 값 |
82 |
88 |
94 |
100 |
오차 |
1 |
-5 |
3 |
3 |