더북(TheBook)

이를 가중치로 사용하면 됩니다. 여기에서는 을 이용해서 가까이 위치할수록 더 높은 가중치를 받도록 합니다. 반대로 멀리 떨어진 최근접 이웃이라면 낮은 가중치를 부여합니다. 전체 합을 분모에 넣어 표준화하면 모든 값의 합을 1로 만들 수 있습니다. 평균값과 가중 평균값을 비교해 볼까요?

 

In [7]:

values = np.array([4, 6, 8])

mean = np.mean(values)
wgt_mean = np.dot(values, weights)

print("Mean:", mean)
print("Weighted Mean:", wgt_mean)
Mean: 6.0
Weighted Mean: 6.4

 

그림 4-2를 보면 균형 다이어그램이 조금 달라졌습니다. 가중치가 줄어든 사례들은 기계적인 레버리지가 적어지기 때문에 균형점에 더 가까이 이동합니다. 반대로 가중치가 더해진 사례들은 균형점으로부터 더 멀어지면서 더욱 큰 영향력을 얻게 되었습니다.

▲ 그림 4-2 평균에 대한 가중치 효과

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.