더북(TheBook)

4.1.4 사이킷런 추정기 API 익히기

이전 절에서 사이킷런의 SimpleImputer 클래스를 사용하여 데이터셋에 있는 누락된 값을 대체했습니다. SimpleImputer 클래스는 사이킷런의 변환기(transformer) API의 일부입니다. 변환기 API를 사용하면 데이터 변환에 관련된 파이썬 클래스를 구현할 수 있습니다(사이킷런의 변환기 API를 16장에서 자세히 다룰 자연어 처리 분야에서 사용되는 트랜스포머 아키텍처와 혼동하지 마세요). 이런 추정기의 주요 메서드 두 개는 fittransform입니다. fit 메서드를 사용하여 훈련 데이터에서 모델 파라미터를 학습합니다. transform 메서드를 사용하여 학습한 파라미터로 데이터를 변환합니다. 변환하려는 데이터 배열은 모델 학습에 사용한 데이터의 특성 개수와 같아야 합니다.

그림 4-2는 훈련 데이터셋에서 학습한 변환기가 훈련 데이터셋과 테스트 데이터셋을 변환하는 과정을 보여 줍니다.

▲ 그림 4-2 데이터 변환을 위한 사이킷런 API

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.