더북(TheBook)

kaggle_test를 입력해 파일 내용을 보면 그림 22-8과 같습니다.

 

그림 22-8 | kaggle_test 파일 내용 미리 보기

 

테스트셋의 속성은 학습셋과 동일한 상태로 변형되어야 해당 모델을 적용할 수 있습니다. 이를 위해 학습셋과 동일하게 전처리되어야 합니다(15.2절 참조). 먼저 카테고리형 변수를 0과 1로 이루어진 변수로 바꾸어 주겠습니다.

kaggle_test = pd.get_dummies(kaggle_test)

그리고 결측치를 전체 칼럼의 평균으로 대체해 채워 줍니다.

kaggle_test = kaggle_test.fillna(kaggle_test.mean())
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.