더북(TheBook)

6.1 파이프라인을 사용한 효율적인 워크플로

이전 장들에서 여러 가지 전처리 기법을 적용했습니다. 4장에서는 특성의 스케일을 조정하기 위해 표준화를 적용했고 5장에서는 데이터 압축을 위해 주성분 분석을 적용했습니다. 이때 테스트 데이터셋에 있는 별도의 샘플처럼 새로운 데이터의 스케일을 조정하고 압축하기 위해 훈련 데이터셋에서 학습한 파라미터를 재사용해야 한다고 배웠습니다. 이를 위해 아주 유용하게 사용할 수 있는 사이킷런의 Pipeline 클래스를 이 절에서 배우겠습니다. 이 도구를 사용하면 여러 개의 변환 단계를 포함한 모델을 학습하고 새로운 데이터에 대한 예측을 만들 수 있습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.