먼저 필요한 데이터를 불러오겠습니다. 데이터는 내려받은 예제 파일의 data 폴더에 있는 train.csv 파일을 사용합니다.7

    코드 3-9 라이브러리 호출 및 데이터 준비

    import pandas as pd
    df = pd.read_csv('../chap3/data/titanic/train.csv', index_col='PassengerId') ------ 판다스를 이용하여 train.csv 파일을 로드해서 df에 저장
    print(df.head()) ------ train.csv 데이터의 상위 행 다섯 개를 출력

    라이브러리 호출 및 데이터 준비 코드를 실행하면 다음과 같이 출력됩니다.

                Survived   Pclass \
    PassengerId
    1                 0         3
    2                 1         1
    3                 1         3
    4                 1         1
    5                 0         3
    
                                                               Name       Sex    Age \
    PassengerId
    1                                       Braund, Mr. Owen Harris      male   22.0
    2             Cumings, Mrs. John Bradley (Florence Briggs Th...    female   38.0
    3                                       Heikkinen, Miss. Laina     female   26.0
    4                 Futrelle, Mrs. Jacques Heath (Lily May Peel)     female   35.0
    5                                     Allen, Mr. William Henry       male   35.0
    
                 SibSp  Parch            Ticket     Fare  Cabin  Embarked
    PassengerId
    1                1      0         A/5 21171   7.2500    NaN         S
    2                1      0          PC 17599  71.2833    C85         C
    3                0      0  STON/O2. 3101282   7.9250    NaN         S
    4                1      0            113803  53.1000   C123         S
    5                0      0 3           73450   8.0500    NaN         S

     

     


      7 캐글에서 제공하는 타이타닉 데이터셋입니다(https://www.kaggle.com/c/titanic/data).

    신간 소식 구독하기
    뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.