더북(TheBook)

먼저 필요한 라이브러리를 호출합니다.

코드 3-34 라이브러리 호출

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

from sklearn.cluster import DBSCAN ------ 밀도 기반 군집 분석
from sklearn.preprocessing import StandardScaler
from sklearn.preprocessing import normalize
from sklearn.decomposition import PCA

훈련을 위해 내려받은 예제 파일에서 data 폴더에 있는 credit card.csv 파일을 불러옵니다.13

코드 3-35 데이터 불러오기

X = pd.read_csv('../chap3/data/credit card.csv')
X = X.drop('CUST_ID', axis=1) ------ 불러온 데이터에서 ‘CUST_ID’ 열(칼럼)을 삭제
X.fillna(method='ffill', inplace=True) ------ ①
print(X.head()) ------ 데이터셋 형태 확인

 

 


13 캐글에서 제공하는 클러스터링을 위한 신용 카드 데이터셋입니다(https://www.kaggle.com/ecedolen/machine-l-on-credit-card-customer-segmentation/data).

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.