더북(TheBook)

데이터셋에 칼럼이 아홉 개 있다. 하나씩 살펴보자.

Pregnancies: 과거 임신 횟수

Glucose: 혈장(plasma) 혈당

BloodPressure: 이완기(diastolic) 혈압

SkinThickness: 삼두근(tricep)에서 측정한 피부두겹두께(skin fold thickness)

Insulin: 혈청(blood serum) 인슐린 농도

BMI: 체질량 지수(Body Mass Index, BMI)

DiabetesPedigreeFunction: 환자가 당뇨에 얼마나 취약한지(유전적 소인이 어느 정도인지) 요약한 점수. 환자의 당뇨 가족력을 바탕으로 추정한다.

Age: 햇수로 계산한 나이

Outcome: 예측 목표 변수. 최초 측정 이후 5년 내 당뇨가 발병하면 값이 1이며, 반대로 미발병하면 0이다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.