① 결측 값을 앞의 값으로 채웁니다.
예를 들어 df.fillna.method='ffill')을 실행할 경우 다음과 같이 앞의 값으로 결측치가 채워집니다.
▲ 그림 3-43 df.fillna( ) 메서드
데이터 전처리 및 차원 축소를 진행합니다.
코드 3-36 데이터 전처리 및 데이터를 2차원으로 차원 축소
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X) ------ 평균이 0, 표준편차가 1이 되도록 데이터 크기를 조정
X_normalized = normalize(X_scaled) ------ 데이터가 가우스 분포를 따르도록 정규화
X_normalized = pd.DataFrame(X_normalized) ------ 넘파일 배열을 데이터프레임(dataframe)으로 변환
pca = PCA(n_components=2) ------ 2차원으로 차원 축소 선언
X_principal = pca.fit_transform(X_normalized) ------ 차원 축소 적용
X_principal = pd.DataFrame(X_principal)
X_principal.columns = ['P1', 'P2']
print(X_principal.head())