더북(TheBook)

5.6 쪼개어 보기: 편향과 분산

이번에는 자동차 레이스 트랙에서 데이터를 분석한다고 상상해 보겠습니다. 트랙 위를 달리는 경주 차량들을 보면서 이들의 위치와 속도를 기록하는 것이죠. 총 주행 거리가 d = 2인 트랙에서 기록을 두 번 잽니다. 그리고 이때 평균 속력 s도 함께 측정합니다. 측정값들을 조합하면 어떤 새로운 정보를 만들어 낼 수 있습니다. 고등학교 물리 시간에 배웠던 것들은 잠시 잊어 보세요. 예를 들어 t1 + t2 = ttotal처럼 두 주행 시간을 더하면 총 주행 시간을 구할 수 있습니다.

운전자

t1

t2

ttotal

s

d

마리오

35

75

110

.018

2

루이지

20

40

60

.033

2

요시

40

50

90

.022

2

테이블에 담긴 여러 측정값을 조합할 때는 다음 몇 가지 사항을 고려해야 합니다. 첫째, 각 항목에 담긴 기록을 오차 없이 정확하게 측정했나요? 둘째, 여러 측정값을 조합할 때 어떤 수학적 연산을 사용할 수 있나요? 여기에서는 덧셈과 곱셈만 가능하다고 가정하겠습니다. 마지막으로 여러 측정값이 갖는 관계를 입력과 출력으로 두겠습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.