경사 상승법 같은 최적화 알고리즘을 사용하여 이 로그 가능도 함수를 최대화할 수 있습니다(경사 상승법은 함수를 최소화하는 것이 아니라 최대화한다는 점만 제외하면 2장에서 설명한 경사 하강법과 동일한 방식으로 작동합니다). 또는 로그 가능도 함수를 다시 손실 함수 L로 표현하여 2장처럼 경사 하강법을 사용하여 최소화할 수 있습니다.
이 손실 함수를 더 잘 이해하기 위해 샘플이 하나일 때 손실을 계산해 보죠.
식을 보면 y = 0일 때 첫 번째 항이 0이 됩니다. y = 1일 때는 두 번째 항이 0이 됩니다.
간단한 코드로 샘플이 하나인 경우 값에 대한 분류 손실을 그려 보겠습니다.