딥러닝 텐서플로 교과서: 3.1.3 결정 트리

먼저 필요한 데이터를 불러오겠습니다. 데이터는 내려받은 예제 파일의 data 폴더에 있는 train.csv 파일을 사용합니다.⁷

코드 3-9 라이브러리 호출 및 데이터 준비

import pandas as pd
df = pd.read_csv('../chap3/data/titanic/train.csv', index_col='PassengerId') ------ 판다스를 이용하여 train.csv 파일을 로드해서 df에 저장
print(df.head()) ------ train.csv 데이터의 상위 행 다섯 개를 출력

라이브러리 호출 및 데이터 준비 코드를 실행하면 다음과 같이 출력됩니다.

            Survived   Pclass \
PassengerId
1                 0         3
2                 1         1
3                 1         3
4                 1         1
5                 0         3

                                                           Name       Sex    Age \
PassengerId
1                                       Braund, Mr. Owen Harris      male   22.0
2             Cumings, Mrs. John Bradley (Florence Briggs Th...    female   38.0
3                                       Heikkinen, Miss. Laina     female   26.0
4                 Futrelle, Mrs. Jacques Heath (Lily May Peel)     female   35.0
5                                     Allen, Mr. William Henry       male   35.0

             SibSp  Parch            Ticket     Fare  Cabin  Embarked
PassengerId
1                1      0         A/5 21171   7.2500    NaN         S
2                1      0          PC 17599  71.2833    C85         C
3                0      0  STON/O2. 3101282   7.9250    NaN         S
4                1      0            113803  53.1000   C123         S
5                0      0 3           73450   8.0500    NaN         S

7 캐글에서 제공하는 타이타닉 데이터셋입니다(https://www.kaggle.com/c/titanic/data).

신간 소식 구독하기

뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.