훈련 데이터와 모델 구조를 사용해 훈련 과정에서 학습된 규칙을 만들어 훈련 모델에 캡슐화합니다. 이 모델은 청사진을 받아 모델 출력을 원하는 입력에 가까워지도록 조금씩 수정(튜닝)합니다. 훈련 단계는 훈련 데이터의 양, 모델 구조의 복잡도, 하드웨어의 속도에 따라 밀리초 또는 여러 날이 걸릴 수 있습니다. 레이블된 데이터를 사용해 모델 출력의 에러를 점진적으로 줄여 가는 이런 종류의 머신 러닝을 지도 학습(supervised learning)13이라고 합니다. 이 책에서 다루는 대부분의 딥러닝 알고리즘은 지도 학습입니다. 모델을 훈련하고 나면 훈련 과정에서 본 적 없는 새로운 데이터에 학습된 규칙을 적용할 수 있습니다. 이 두 번째 단계가 추론 단계(inference phase)입니다. 추론 단계는 훈련 단계보다 많은 계산이 필요하지 않습니다. 그 이유는 1) 훈련은 모든 훈련 데이터를 처리하지만 추론은 일반적으로 한 번에 하나의 입력(예를 들면 하나의 이미지)을 사용하고, 2) 추론 단계에서는 모델이 수정될 필요가 없기 때문입니다.
데이터 표현 학습하기
머신 러닝은 데이터에서 학습하는 것입니다. 그렇다면 정확히 무엇을 학습하는 걸까요? 이에 대한 답은 데이터를 효과적으로 변환하는 방법입니다. 다른 말로 하면, 데이터의 이전 표현을 주어진 문제를 풀기 쉽게 만드는 새로운 표현으로 바꾸는 것입니다.
다음으로 넘어가기 전에 표현이란 무엇인지 알아보죠. 표현의 핵심은 데이터를 바라보는 방법입니다. 동일한 데이터를 다른 방법으로 바라볼 수 있고, 이는 다른 표현을 만듭니다. 예를 들어 컬러 이미지는 RGB 또는 HSV(색상-채도-명도)로 인코딩(encoding)됩니다. 여기에서 인코딩 또는 표현은 근본적으로 같은 것을 의미하며 구분하지 않고 사용할 수 있습니다. 같은 이미지이더라도 다른 두 포맷으로 인코딩하면 픽셀을 나타내는 수치는 완전히 다릅니다. 표현이 다르면 다른 종류의 문제 해결에 유용합니다. 예를 들어 이미지에서 빨간색 영역을 모두 찾으려면 RGB 표현이 훨씬 유리합니다. 하지만 동일한 이미지에서 포화된 색 영역을 찾으려면 HSV 표현이 낫습니다. 예전 표현을 새로운 표현으로 바꾸는 적절한 변환을 찾는 것이 근본적으로 머신 러닝의 전부입니다. 새로운 표현은 이미지에서 자동차의 위치를 식별하거나 이미지에 고양이와 강아지가 포함되어 있는지 판단하는 것 같은 특정 문제를 해결하기 쉽게 만듭니다.