더북(TheBook)
# 필요한 라이브러리를 불러옵니다.
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# 깃허브에 준비된 데이터를 가져옵니다.
!git clone https://github.com/taehojo/data.git

# 피마 인디언 당뇨병 데이터셋을 불러옵니다.
df = pd.read_csv('./data/pima-indians-diabetes3.csv')

판다스 라이브러리의 read_csv() 함수로 csv 파일을 불러와 df라는 이름의 데이터 프레임으로 저장했습니다. csv란 comma separated values의 약어로, 쉼표(,)로 구분된 데이터들의 모음이란 뜻입니다. csv 파일에는 데이터를 설명하는 한 줄이 파일 맨 처음에 나옵니다. 이를 헤더(header)라고 합니다.

이제 불러온 데이터의 내용을 간단히 확인하고자 head() 함수를 이용해 데이터의 첫 다섯 줄을 불러오겠습니다.

df.head(5)
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.