더북(TheBook)

신뢰성

각 점은 초평면과의 거리를 반영한 신뢰성을 가진다. 신뢰성은 확률로 해석될 수 있다. 다음과 같은 수식을 보자.

 

이것은 한 점에 대한 것이다. 우리가 필요한 것은 모든 선 집합에 대한 확률이다. 그래서 개체 각각에 확률이 부여되어 있는 훈련용 데이터로 선 집합에 대한 확률을 알아내야 한다

 

각 점은 독립적이므로 확률을 곱한다. 우리에게는 초평면이 얼마나 정확히 분류하고 있는가를 나타내는 각 점에 대한 수식이 있다. 각 점에 대한 확률을 묶어 놓은 것을 흔히 ‘데이터의 우도(likelihood of the data)’라고 한다. 우리의 목표는 가능한 1에 가까운 숫자를 찾는 것이다.

확률이란 0과 1 사이의 값이라고 설명한 것을 기억하는가? (기억나지 않는다면 4장을 확인하라.) 우리가 찾는 것은 최고의 확률을 가진 선을 만들 수 있는 파라미터 집합이다. 이 선은 개체 집합 내에서 분류가 정확함을 확인해줄 것이다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.