더북(TheBook)

make_pipeline 함수는 여러 개의 사이킷런 변환기(입력에 대해 fit 메서드와 transform 메서드를 지원하는 객체)와 그 뒤에 fit 메서드와 predict 메서드를 구현한 사이킷런 추정기를 연결할 수 있습니다. 앞선 예제에서는 StandardScaler, PCA 두 개의 변환기와 LogisticRegression 추정기를 make_pipeline 함수의 입력으로 넣었습니다. 이 함수는 이 객체들을 사용하여 사이킷런의 Pipeline 클래스 객체를 생성하여 반환합니다.

사이킷런의 Pipeline 클래스를 메타 추정기(meta-estimator)나 개별 변환기와 추정기를 감싼 래퍼(wrapper)로 생각할 수 있습니다. Pipeline 객체의 fit 메서드를 호출하면 데이터가 중간 단계에 있는 모든 변환기의 fit 메서드와 transform 메서드를 차례로 거쳐 추정기 객체(파이프라인의 마지막 단계)에 도달합니다. 추정기는 변환된 훈련 데이터셋을 사용하여 학습합니다.

앞선 예제에서 pipe_lr 파이프라인의 fit 메서드를 호출할 때 먼저 훈련 데이터셋에 StandardScalerfit 메서드와 transform 메서드가 호출됩니다. 변환된 훈련 데이터는 파이프라인의 다음 요소인 PCA 객체로 전달됩니다. 이전 단계와 비슷하게 스케일 조정된 입력 데이터에 PCAfit 메서드와 transform 메서드가 호출됩니다. 그다음 파이프라인의 최종 요소인 추정기에 훈련 데이터가 전달됩니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.