더북(TheBook)

특정 사례의 y가 1이라면 양성 클래스로, 0이라면 음성 클래스로 칭하겠습니다.

주의 ≡

양성과 음성 클래스는 정하기 나름입니다만, 보통 우리가 관심 있는 사건을 양성 클래스로 정의합니다. 사기 거래를 탐지하는 문제를 풀고 있다면 정상 거래가 아닌 사기 거래를 양성 클래스(y = 1)로 설정합니다.

다음은 라벨입니다.

y는 실제 라벨입니다.

ý은 예측 라벨입니다.

데이터셋에 있는 사례들의 실제 라벨 값을 y라고 표기합니다. 어떤 사람이 제품을 구매했다면 y = 1이고 예측 라벨은 ý입니다. 이 문제에서 입력 특성 벡터 x의 차원 수는 4입니다. 우리가 알고 싶은 것은 특정한 입력이 주어졌을 때 해당 고객이 구매할 확률입니다.

그러므로 특성 벡터 x가 주어졌을 때 y = 1일 확률을 출력합니다. 수학적으로는 다음과 같이 표현합니다.

ý = P(y = 1|x) : where; xnx

다음 절에서는 입력 변수들을 전처리하여 특성 벡터 x로 만드는 과정에 대해 자세히 알아봅시다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.