더북(TheBook)

하이 레벨의 모델링 단계에서 지도 학습 시스템을 만드는 데 내려야 할 중요한 결정 사항들이 있습니다.

1. 우리가 가진 데이터에서 어떤 것이 타깃이고 특성입니까?

2. 입력 특성과 타깃 특성을 연결하는 데 어떤 종류의 학습 모델을 사용할 것입니까?

3. 데이터와 모델이 부정적으로 상호 작용하나요? 그렇다면 모델 구축의 한 과정으로 추가 데이터를 준비해야 할 필요가 있나요?

4. 모델을 어떻게 학습해야 할까요? 사용하는 알고리즘은 무엇인가요?

 

이러한 질문들은 학습 시스템에 대한 생각을 정리하는 데 도움을 주지만, 이외에도 생각할 것이 많습니다. 추상적인 모델이나 플로차트 다이어그램은 지저분한 현실 세계를 절대 모두 담아내지 못합니다. 현실 세계에서는 보통 (1) 데이터가 이미 존재하는 상황 혹은 (2) 의사결정권자들이 원하는 것을 결정한 상태에서 학습 시스템을 만드는 사람들을 호출합니다. 어쩔 수 없습니다. 그래서 저는 데이터 수집, 실험 설계, 문제 정의 등에 대한 디테일은 다루지 않을 것입니다. 그 대신 데이터 무더기를 쓸모 있는 사례로 만들고, 여러 학습 모델을 적용하고, 결과를 평가한 후 대안과 비교할 것입니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.