먼저 필요한 라이브러리를 호출합니다.
코드 3-34 라이브러리 호출
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.cluster import DBSCAN ------ 밀도 기반 군집 분석
from sklearn.preprocessing import StandardScaler
from sklearn.preprocessing import normalize
from sklearn.decomposition import PCA
훈련을 위해 내려받은 예제 파일에서 data 폴더에 있는 credit card.csv 파일을 불러옵니다.13
코드 3-35 데이터 불러오기
X = pd.read_csv('../chap3/data/credit card.csv')
X = X.drop('CUST_ID', axis=1) ------ 불러온 데이터에서 ‘CUST_ID’ 열(칼럼)을 삭제
X.fillna(method='ffill', inplace=True) ------ ①
print(X.head()) ------ 데이터셋 형태 확인
13 캐글에서 제공하는 클러스터링을 위한 신용 카드 데이터셋입니다(https://www.kaggle.com/ecedolen/machine-l-on-credit-card-customer-segmentation/data).