더북(TheBook)

7.4.2 모델

데이터 확인과 더불어 전처리도 어느 정도 끝났으니, 이제 데이터셋을 스펀지처럼 빨아들일 모델을 구성해볼 차례입니다. 데이터를 분석하면서 얻은 인사이트를 토대로 어떤 종류의 모델을 선정하는 것이 좋을지, 모델 성능과는 별개로 내가 가진 컴퓨팅 리소스에 적절한 모델은 무엇인지 알아보고 가장 적절한 모델을 베이스로 시작해보는 것이지요.

물론 이 과정에서 추가로 데이터를 더 작업해야 하는 경우가 생길 수도 있고, 어느 정도 성능이 나오지 않는다면 모델을 바꿀 수도 있습니다. 또 다양한 모델과 앙상블해볼 수도 있지요. 여러 가지를 시도해보면서 주어진 데이터를 입력으로, 내가 원하는 답을 가장 잘 표현해줄 수 있는 모델을 만드는 것입니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.