특정 사례의 y가 1이라면 양성 클래스로, 0이라면 음성 클래스로 칭하겠습니다.

    주의 ≡

    양성과 음성 클래스는 정하기 나름입니다만, 보통 우리가 관심 있는 사건을 양성 클래스로 정의합니다. 사기 거래를 탐지하는 문제를 풀고 있다면 정상 거래가 아닌 사기 거래를 양성 클래스(y = 1)로 설정합니다.

    다음은 라벨입니다.

    y는 실제 라벨입니다.

    ý은 예측 라벨입니다.

    데이터셋에 있는 사례들의 실제 라벨 값을 y라고 표기합니다. 어떤 사람이 제품을 구매했다면 y = 1이고 예측 라벨은 ý입니다. 이 문제에서 입력 특성 벡터 x의 차원 수는 4입니다. 우리가 알고 싶은 것은 특정한 입력이 주어졌을 때 해당 고객이 구매할 확률입니다.

    그러므로 특성 벡터 x가 주어졌을 때 y = 1일 확률을 출력합니다. 수학적으로는 다음과 같이 표현합니다.

    ý = P(y = 1|x) : where; xnx

    다음 절에서는 입력 변수들을 전처리하여 특성 벡터 x로 만드는 과정에 대해 자세히 알아봅시다.

    신간 소식 구독하기
    뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.