더북(TheBook)

01 | 타이타닉 데이터 형식

타이타닉 데이터는 반더빌트 대학교Vanderbilt Univerity의 바이오 통계학과 데이터 셋 위키 페이지(http://biostat.mc.vanderbilt.edu/wiki/Main/DataSets)에서 다운로드할 수 있다. 해당 페이지에서 ‘Data for Titanic passengers’ 섹션을 찾아 titanic3.csv를 다운로드하기 바란다.

타이타닉 데이터는 CSV 파일 형식으로 저장되어 있으며, 이 장에서는 CSV 파일의 일부 컬럼만 사용할 것이다. 표 11-1은 이 장에서 사용할 컬럼에 대한 설명이다.

표 11-1 타이타닉 데이터 셋

컬럼명

의미

pclass

1, 2, 3등석 정보를 각각 1, 2, 3으로 저장

survived

생존 여부. survived(생존), dead(사망)

name

이름

sex

성별. female(여성), male(남성)

age

나이

sibsp

함께 탑승한 형제 또는 배우자의 수

parch

함께 탑승한 부모 또는 자녀의 수

ticket

티켓 번호

fare

티켓 요금

cabin

선실 번호

embarked

탑승한 곳. C(Cherbourg), Q(Queenstown), S(Southampton)

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.