더북(TheBook)

1.4.2 값 예측: 회귀 모델 사례

현대 사회에는 수치 값이 넘쳐 납니다. 물리적 측정치(기온, 거리, 질량), 화폐 가치, 퍼센트, 점수 등 다양한 수치를 측정하고 기록하고, 끊임없이 처리합니다. 이러한 값들은 여러 가지 흥미로운 문제를 풀 수 있는 타깃 값이 됩니다.

1. 교과 성적 예측

학생들의 시험 성적을 예측할 수 있습니다. 그렇게 함으로써 시험을 앞두고 힘들어 하는 학생들을 도울 수 있습니다. 숙제 완료율, 수업 참석 횟수, 수업 참여율이나 과거 시험에서 얻은 성적을 특성으로 사용할 수 있습니다. 또 학생기록부나 이전 담당 교사에게서 받은 추천서 같은 것도 추가할 수 있습니다. 다른 회귀 문제처럼 이 회귀 문제 역시 통과/탈락이나 시험 점수 대신 등급을 부여함으로써 분류 문제로 변환할 수 있습니다.

2. 주가 예측

주식을 살지/팔지 결정하는 분류 모델과 비슷한 방식으로, 미래의 주식 가격을 예측할 수 있습니다. 회귀 문제가 분류 문제보다 조금 더 어려워 보이네요. ‘주식 가격을 오른다 혹은 내린다’로 넓게 분류하는 것이 아니라 다음 주에 주가가 $20.73가 될 것이라고 예측하려고 하기 때문입니다. 입력 데이터는 난이도와 관계없이 동일합니다. 일자별 매매 정보와 더불어 분기별 재무제표 같은 재무 정보를 사용합니다.

3. 웹에서 행동 예측

온라인 유저의 검색과 구매 히스토리를 이용해서 그 유저가 광고 링크를 클릭할 가능성이나 온라인 상점에서 아이템을 구매할 확률을 예측합니다. 검색과 구매 히스토리는 수치형 데이터가 아니지만, 타깃 값은 수치형입니다. 즉, 이것은 회귀 문제입니다. 이미지 분류 문제처럼 이 문제는 전반적인 결과에 기여하는 수많은 작은 정보 조각을 가지고 있습니다. 이 조각들이 서로 어떻게 연결되었는지 맥락이 있어야 그 가치를 제대로 활용할 수 있습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.