1.1.2 머신 러닝 워크플로
지금까지 머신 러닝이 무엇인지 알아보았다. 그러면 머신 러닝은 어떻게 구현해야 할까? 간단히 말해, 머신 러닝도 다른 프로그램과 마찬가지로 데이터를 입력받고 예측 결과를 출력한다. 물론 머신 러닝을 구현하려면 중요한 중간 과정을 여럿 거쳐야 한다. 그림 1-3은 머신 러닝 프로그램의 워크플로를 요약한 것이다.
▲ 그림 1-3 머신 러닝 워크플로
머신 러닝 워크플로의 입력은 당연히 데이터다. 데이터는 다양한 소스에 다양한 형식으로 저장된다. 예를 들어 컴퓨터 비전 분야의 머신 러닝 입력 데이터는 대체로 이미지 형식이다. 그 외 다른 머신 러닝 워크플로는 대부분 스프레드시트 같은 테이블 형식 데이터를 입력으로 사용한다. 머신 러닝 프로젝트를 진행하다 보면, 머신 러닝 모델을 만들기 전에 먼저 데이터 수집 작업에 많은 노력을 들여야 할 때가 많다. 책에서는 입력 데이터가 이미 주어지고 오직 머신 러닝 모델에 집중하는 상황을 가정한다.