더북(TheBook)

5.2.2 기술적으로 이야기하자면

다시 정리해 봅시다. 이제 우리는 세 가지 데이터 세트를 가지고 있습니다. 단계별로 어떤 데이터 세트가 필요한지 이야기해 볼게요.

최종적인 목표부터 기본 모델을 학습하는 순서대로 작업을 살펴보겠습니다.

1. 조정이 잘된 단일 기계를 고객에게 인도하려고 합니다. 고객이 기계를 사용할 때 정상적인 성능을 보일지 최종적인 검증이 필요합니다.

2. 문제 상황을 고려하여 후보 기계를 몇 가지 선정했습니다. 최종 검증에 사용할 데이터를 이용하지 않고 후보 기계들의 성능을 비교하고자 합니다.

3. 각 후보 기계들이 가진 손잡이 설정을 최적화합니다. 이 과정에서 다른 단계에 쓸 데이터는 사용하지 않습니다. 기계를 하나 고르고 그 손잡이를 조정합니다.

 

학습 단계와 데이터 세트

앞서 설명한 세 단계는 저마다 평가 기준이 있습니다. 그리고 그 평가 기준은 서로 다른 입력-출력 쌍을 이용합니다. 각 단계와 데이터 세트에 이름을 붙여 봅시다. 공장 기계는 모델에 대한 비유라는 점을 기억하세요.

1. 평가: 공장 기계가 실제 작업 환경에서 어떻게 작동할지에 대한 최종 평가

2. 선택: 유사 기계군(k-NN에서 k가 다른) 혹은 비유사 기계군(k-NN, 나이브 베이즈)에 속한 여러 기계의 성능을 측정하고 비교

3. 훈련: 공장 기계에 정보를 입력하여 손잡이를 최적의 설정으로 맞추는 작업

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.