훈련을 위해 내려받은 예제 파일에서 data 폴더에 있는 credit card.csv 파일을 불러옵니다.14
코드 3-35 데이터 불러오기
X = pd.read_csv('../chap03/data/credit card.csv')
X = X.drop('CUST_ID', axis=1) ------ 불러온 데이터에서 ‘CUST_ID’ 열(칼럼)을 삭제
X.fillna(method='ffill', inplace=True) ------ ①
print(X.head()) ------ 데이터셋 형태 확인
코드를 실행하면 credit card.csv 파일의 데이터셋 정보를 보여 줍니다.
BALANCE BALANCE_FREQUENCY PURCHASES ONEOFF_PURCHASES \ 0 40.900749 0.818182 95.40 0.00 1 3202.467416 0.909091 0.00 0.00 2 2495.148862 1.000000 773.17 773.17 3 1666.670542 0.636364 1499.00 1499.00 4 817.714335 1.000000 16.00 16.00 INSTALLMENTS_PURCHASES CASH_ADVANCE PURCHASES_FREQUENCY \ 0 95.4 0.000000 0.166667 1 0.0 6442.945483 0.000000 2 0.0 0.000000 1.000000 3 0.0 205.788017 0.083333 4 0.0 0.000000 0.083333 ONEOFF_PURCHASES_FREQUENCY PURCHASES_INSTALLMENTS_FREQUENCY \ 0 0.000000 0.083333 1 0.000000 0.000000 2 1.000000 0.000000 3 0.083333 0.000000 4 0.083333 0.000000 CASH_ADVANCE_FREQUENCY CASH_ADVANCE_TRX PURCHASES_TRX CREDIT_LIMIT \ 0 0.000000 0 2 1000.0 1 0.250000 4 0 7000.0 2 0.000000 0 12 7500.0 3 0.083333 1 1 7500.0 4 0.000000 0 1 1200.0 PAYMENTS MINIMUM_PAYMENTS PRC_FULL_PAYMENT TENURE 0 201.802084 139.509787 0.000000 12 1 4103.032597 1072.340217 0.222222 12 2 622.066742 627.284787 0.000000 12 3 0.000000 627.284787 0.000000 12 4 678.334763 244.791237 0.000000 12