더북(TheBook)

이진 분류를 위한 확률 모델로서 로지스틱 회귀 모델 이면에 있는 아이디어를 설명하기 위해 먼저 오즈비(odds ratio)를 소개합니다. 오즈는 특정 이벤트가 발생할 확률입니다. 오즈비는 처럼 쓸 수 있습니다. 여기에서 P는 양성 샘플일 확률입니다. 양성 샘플은 좋은 것을 의미하지 않고 예측하려는 대상을 말합니다. 예를 들어 특정 증상을 보이는 환자가 어떤 질병에 걸렸을 확률입니다. 양성 샘플이 클래스 레이블 y = 1인 샘플이고 증상을 특성 x로 생각할 수 있습니다. 따라서 확률 p를 특성이 x인 샘플이 클래스 1에 속할 조건부 확률 p := p(y = 1 | x)로 정의할 수 있습니다.

오즈비에 로그 함수(로그 오즈)를 취해 로짓(logit) 함수를 정의합니다.

여기에서 log는 컴퓨터 과학에서 널리 사용되는 자연 로그입니다. logit 함수는 0과 1 사이의 입력 값을 받아 실수 범위 값으로 변환합니다.

로지스틱 모델에서는 가중치가 적용된 입력(2장의 최종 입력)과 로그 오즈 사이에 선형 관계가 있다고 가정합니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.