더북(TheBook)

주의 ≡

CRISP-DM 라이프 사이클의 2단계(데이터 이해)와 3단계(데이터 준비)는 모델을 훈련하기 위해 필요한 데이터를 이해하고 준비하는 과정입니다. 이 단계는 데이터 전처리를 포함합니다. 어떤 조직에서는 이 데이터 엔지니어링 단계를 위해 전문가를 고용하기도 합니다.

지금까지 소개한 문제 해결 과정은 전부 데이터를 기반으로 진행됩니다. 실행 가능한 솔루션을 만들기 위해 지도 학습과 비지도 학습을 결합했습니다. 이 장은 그 중에서 비지도 학습에 집중합니다.

주의 ≡

데이터 엔지니어링이란 2단계와 3단계로 구성되어 있으며, 머신러닝에서 시간이 가장 많이 소요되는 부분입니다. 데이터 엔지니어링에 드는 시간과 자원은 전형적인 머신러닝 프로젝트에서 대략 70%를 차지합니다. 데이터 엔지니어링에서 비지도 학습은 중요한 역할을 수행합니다.

다음 절에서 비지도 학습에 대해 더 자세히 알아봅시다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.