5.6 쪼개어 보기: 편향과 분산
이번에는 자동차 레이스 트랙에서 데이터를 분석한다고 상상해 보겠습니다. 트랙 위를 달리는 경주 차량들을 보면서 이들의 위치와 속도를 기록하는 것이죠. 총 주행 거리가 d = 2인 트랙에서 기록을 두 번 잽니다. 그리고 이때 평균 속력 s도 함께 측정합니다. 측정값들을 조합하면 어떤 새로운 정보를 만들어 낼 수 있습니다. 고등학교 물리 시간에 배웠던 것들은 잠시 잊어 보세요. 예를 들어 t1 + t2 = ttotal처럼 두 주행 시간을 더하면 총 주행 시간을 구할 수 있습니다.
운전자 |
t1 |
t2 |
ttotal |
s |
d |
마리오 |
35 |
75 |
110 |
.018 |
2 |
루이지 |
20 |
40 |
60 |
.033 |
2 |
요시 |
40 |
50 |
90 |
.022 |
2 |
테이블에 담긴 여러 측정값을 조합할 때는 다음 몇 가지 사항을 고려해야 합니다. 첫째, 각 항목에 담긴 기록을 오차 없이 정확하게 측정했나요? 둘째, 여러 측정값을 조합할 때 어떤 수학적 연산을 사용할 수 있나요? 여기에서는 덧셈과 곱셈만 가능하다고 가정하겠습니다. 마지막으로 여러 측정값이 갖는 관계를 입력과 출력으로 두겠습니다.