더북(TheBook)

① 결측 값을 앞의 값으로 채웁니다.

예를 들어 df.fillna.method='ffill')을 실행할 경우 다음과 같이 앞의 값으로 결측치가 채워집니다.

▲ 그림 3-43 df.fillna( ) 메서드

데이터 전처리 및 차원 축소를 진행합니다.

코드 3-36 데이터 전처리 및 데이터를 2차원으로 차원 축소

scaler = StandardScaler()
X_scaled = scaler.fit_transform(X) ------ 평균이 0, 표준편차가 1이 되도록 데이터 크기를 조정

X_normalized = normalize(X_scaled) ------ 데이터가 가우스 분포를 따르도록 정규화
X_normalized = pd.DataFrame(X_normalized) ------ 넘파일 배열을 데이터프레임(dataframe)으로 변환

pca = PCA(n_components=2) ------ 2차원으로 차원 축소 선언
X_principal = pca.fit_transform(X_normalized) ------ 차원 축소 적용
X_principal = pd.DataFrame(X_principal)
X_principal.columns = ['P1', 'P2']
print(X_principal.head())
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.