먼저 필요한 데이터를 불러오겠습니다. 데이터는 내려받은 예제 파일의 data 폴더에 있는 train.csv 파일을 사용합니다.7
코드 3-9 라이브러리 호출 및 데이터 준비
import pandas as pd
df = pd.read_csv('../chap3/data/titanic/train.csv', index_col='PassengerId') ------ 판다스를 이용하여 train.csv 파일을 로드해서 df에 저장
print(df.head()) ------ train.csv 데이터의 상위 행 다섯 개를 출력
라이브러리 호출 및 데이터 준비 코드를 실행하면 다음과 같이 출력됩니다.
Survived Pclass \
PassengerId
1 0 3
2 1 1
3 1 3
4 1 1
5 0 3
Name Sex Age \
PassengerId
1 Braund, Mr. Owen Harris male 22.0
2 Cumings, Mrs. John Bradley (Florence Briggs Th... female 38.0
3 Heikkinen, Miss. Laina female 26.0
4 Futrelle, Mrs. Jacques Heath (Lily May Peel) female 35.0
5 Allen, Mr. William Henry male 35.0
SibSp Parch Ticket Fare Cabin Embarked
PassengerId
1 1 0 A/5 21171 7.2500 NaN S
2 1 0 PC 17599 71.2833 C85 C
3 0 0 STON/O2. 3101282 7.9250 NaN S
4 1 0 113803 53.1000 C123 S
5 0 0 3 73450 8.0500 NaN S
7 캐글에서 제공하는 타이타닉 데이터셋입니다(https://www.kaggle.com/c/titanic/data).