더북(TheBook)

7.4.7 클래스 확률 예측

검증용 데이터셋을 사용해 클래스별 확률을 구한다. 확률이므로 각 클래스의 확률을 더하면 1.0이 된다.

predict_proba 함수는 각 샘플에 대해 어느 클래스에 속할 확률을 0에서 1 사이의 값으로 돌려준다.

predict 함수는 새로운 속성들을 넣었을 때 그 클래스에 속하는지 속하지 않는지를 나타내는 1 또는 0으로 구성된 벡터를 반환해준다. 여기서 predict 함수를 사용해 클래스의 레이블(정답에 해당하는 부분, 즉 매수 또는 매도)을 예측한다.

# 검증용 데이터를 사용해 확률값을 구한다
probability = model.predict_proba( X_test )
print( probability )

predict_proba 함수는 [ prob1 prob2 ]와 같은 형식으로 샘플 X_test가 ‘매수’ 또는 ‘매도’ 클래스 레이블에 속할 확률을 보여준다. 따라서 두 개의 확률값인 prob1prob2의 합은 1이다.

# 검증용 데이터를 사용해 예측을 한다
predicted = model.predict( X_test )
print( predicted )

predict 함수는 predict_proba 함수의 결과를 1과 -1로 표시한 것이다. 여기서 predict_proba 함수의 결과([prob1 prob2])에서 prob1>prob2이면 -1, 그렇지 않으면 1로 표시한 것이다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.