1.6 요약
이 장에서는 매우 넓은 시각으로 머신 러닝을 바라보았습니다. 큰 그림에 익숙해졌고 이어지는 장에서 자세히 살펴볼 주요 개념을 둘러보았습니다. 지도 학습의 주요 하위 분야 두 개는 분류와 회귀입니다. 분류 모델은 샘플을 알려진 클래스로 분류합니다. 회귀 분석은 타깃 변수의 연속된 출력을 예측합니다. 비지도 학습은 레이블되지 않은 데이터에서 구조를 찾는 유용한 기법입니다. 또 전처리 단계에서 데이터 압축에도 유용하게 사용합니다.
머신 러닝을 적용하는 전형적인 로드맵도 간략히 살펴보았습니다. 이를 바탕으로 이어지는 장에서 좀 더 깊은 주제와 실전 예제를 다루겠습니다. 마지막으로 파이썬 환경과 필수 패키지를 설치하고 업데이트해서 머신 러닝을 작업할 준비를 마쳤습니다.
책 뒷부분에서 머신 러닝 이외에도 데이터셋을 전처리하는 여러 기법을 소개합니다. 머신 러닝 알고리즘의 성능을 최대로 끌어내는 데 도움이 될 것입니다. 분류 알고리즘을 폭넓게 다루겠지만 회귀 분석과 군집 알고리즘도 살펴볼 것입니다.