01 | 타이타닉 데이터 형식

    타이타닉 데이터는 반더빌트 대학교Vanderbilt Univerity의 바이오 통계학과 데이터 셋 위키 페이지(http://biostat.mc.vanderbilt.edu/wiki/Main/DataSets)에서 다운로드할 수 있다. 해당 페이지에서 ‘Data for Titanic passengers’ 섹션을 찾아 titanic3.csv를 다운로드하기 바란다.

    타이타닉 데이터는 CSV 파일 형식으로 저장되어 있으며, 이 장에서는 CSV 파일의 일부 컬럼만 사용할 것이다. 표 11-1은 이 장에서 사용할 컬럼에 대한 설명이다.

    표 11-1 타이타닉 데이터 셋

    컬럼명

    의미

    pclass

    1, 2, 3등석 정보를 각각 1, 2, 3으로 저장

    survived

    생존 여부. survived(생존), dead(사망)

    name

    이름

    sex

    성별. female(여성), male(남성)

    age

    나이

    sibsp

    함께 탑승한 형제 또는 배우자의 수

    parch

    함께 탑승한 부모 또는 자녀의 수

    ticket

    티켓 번호

    fare

    티켓 요금

    cabin

    선실 번호

    embarked

    탑승한 곳. C(Cherbourg), Q(Queenstown), S(Southampton)

    신간 소식 구독하기
    뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.