7.1.2 지도 학습의 필요 조건
지도 학습 알고리즘은 사례를 이용해 모델을 훈련합니다. 이 알고리즘을 실행하려면 몇 가지 특정한 조건을 만족해야 합니다. 조건은 다음과 같습니다.
• 충분히 많은 사례: 지도 학습 알고리즘으로 모델을 훈련하려면 훈련에 사용하려는 사례가 충분히 많아야 합니다.
• 데이터의 패턴: 훈련에 사용하려는 사례는 어떤 패턴이 있어야 합니다. 우리가 관심 있는 이벤트가 발생할 가능성은 어떤 패턴이나 트렌드, 이벤트의 조합에 의존적이어야 합니다. 그렇지 않다면 우리에게 주어진 데이터는 무작위 소음과 다르지 않으므로 이를 모델 훈련에 사용할 수 없습니다.
• 유효한 가정: 지도 학습 알고리즘을 사용할 때 우리는 훈련에 사용한 사례에 적용된 가정이 미래에도 여전히 유효할 것이라고 기대합니다. 구체적인 예를 들어 보겠습니다. 학생이 비자를 받을지 예측하는 모델을 만들어 정부에 납품할 때 우리는 훈련에 사용한 관련 법령이나 정책이 예측 단계에서도 그대로 유지될 것이라 가정합니다. 만약 훈련이 끝난 후에 새로운 정책이나 법이 제정된다면 새로운 정보를 처리하기 위해 모델을 다시 학습해야 할 수도 있습니다.