01 | 타이타닉 데이터 형식
타이타닉 데이터는 반더빌트 대학교Vanderbilt Univerity의 바이오 통계학과 데이터 셋 위키 페이지(http://biostat.mc.vanderbilt.edu/wiki/Main/DataSets)에서 다운로드할 수 있다. 해당 페이지에서 ‘Data for Titanic passengers’ 섹션을 찾아 titanic3.csv를 다운로드하기 바란다.
타이타닉 데이터는 CSV 파일 형식으로 저장되어 있으며, 이 장에서는 CSV 파일의 일부 컬럼만 사용할 것이다. 표 11-1은 이 장에서 사용할 컬럼에 대한 설명이다.
컬럼명 |
의미 |
pclass |
1, 2, 3등석 정보를 각각 1, 2, 3으로 저장 |
survived |
생존 여부. survived(생존), dead(사망) |
name |
이름 |
sex |
성별. female(여성), male(남성) |
age |
나이 |
sibsp |
함께 탑승한 형제 또는 배우자의 수 |
parch |
함께 탑승한 부모 또는 자녀의 수 |
ticket |
티켓 번호 |
fare |
티켓 요금 |
cabin |
선실 번호 |
embarked |
탑승한 곳. C(Cherbourg), Q(Queenstown), S(Southampton) |