데이터셋에 칼럼이 아홉 개 있다. 하나씩 살펴보자.
• Pregnancies: 과거 임신 횟수
• Glucose: 혈장(plasma) 혈당
• BloodPressure: 이완기(diastolic) 혈압
• SkinThickness: 삼두근(tricep)에서 측정한 피부두겹두께(skin fold thickness)
• Insulin: 혈청(blood serum) 인슐린 농도
• BMI: 체질량 지수(Body Mass Index, BMI)
• DiabetesPedigreeFunction: 환자가 당뇨에 얼마나 취약한지(유전적 소인이 어느 정도인지) 요약한 점수. 환자의 당뇨 가족력을 바탕으로 추정한다.
• Age: 햇수로 계산한 나이
• Outcome: 예측 목표 변수. 최초 측정 이후 5년 내 당뇨가 발병하면 값이 1이며, 반대로 미발병하면 0이다.