# 필요한 라이브러리를 불러옵니다. import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # 깃허브에 준비된 데이터를 가져옵니다. !git clone https://github.com/taehojo/data.git # 피마 인디언 당뇨병 데이터셋을 불러옵니다. = pd.read_csv('./data/pima-indians-diabetes3.csv')
판다스 라이브러리의 read_csv() 함수로 csv 파일을 불러와 df라는 이름의 데이터 프레임으로 저장했습니다. csv란 comma separated values의 약어로, 쉼표(,)로 구분된 데이터들의 모음이란 뜻입니다. csv 파일에는 데이터를 설명하는 한 줄이 파일 맨 처음에 나옵니다. 이를 헤더(header)라고 합니다.
이제 불러온 데이터의 내용을 간단히 확인하고자 head() 함수를 이용해 데이터의 첫 다섯 줄을 불러오겠습니다.
df.head(5)