더북(TheBook)

4.1.4 사이킷런 추정기 API 익히기

이전 절에서 사이킷런의 SimpleImputer 클래스를 사용하여 데이터셋에 있는 누락된 값을 대체했습니다. SimpleImputer 클래스는 데이터 변환에 사용되는 사이킷런의 변환기(transformer) 클래스입니다. 이런 추정기의 주요 메서드 두 개는 fittransform입니다. fit 메서드를 사용하여 훈련 데이터에서 모델 파라미터를 학습합니다. transform 메서드를 사용하여 학습한 파라미터로 데이터를 변환합니다. 변환하려는 데이터 배열은 모델 학습에 사용한 데이터의 특성 개수와 같아야 합니다.

그림 4-1은 훈련 데이터셋에서 학습한 변환기가 훈련 데이터셋과 테스트 데이터셋을 변환하는 과정을 보여 줍니다.

▲ 그림 4-1 사이킷런 변환기의 훈련과 변환 과정

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.