kaggle_test를 입력해 파일 내용을 보면 그림 22-8과 같습니다.
그림 22-8 | kaggle_test 파일 내용 미리 보기
테스트셋의 속성은 학습셋과 동일한 상태로 변형되어야 해당 모델을 적용할 수 있습니다. 이를 위해 학습셋과 동일하게 전처리되어야 합니다(15.2절 참조). 먼저 카테고리형 변수를 0과 1로 이루어진 변수로 바꾸어 주겠습니다.
pd.get_dummies( )=
그리고 결측치를 전체 칼럼의 평균으로 대체해 채워 줍니다.
fillna( .mean())= .