데이터셋에 칼럼이 아홉 개 있다. 하나씩 살펴보자.

    Pregnancies: 과거 임신 횟수

    Glucose: 혈장(plasma) 혈당

    BloodPressure: 이완기(diastolic) 혈압

    SkinThickness: 삼두근(tricep)에서 측정한 피부두겹두께(skin fold thickness)

    Insulin: 혈청(blood serum) 인슐린 농도

    BMI: 체질량 지수(Body Mass Index, BMI)

    DiabetesPedigreeFunction: 환자가 당뇨에 얼마나 취약한지(유전적 소인이 어느 정도인지) 요약한 점수. 환자의 당뇨 가족력을 바탕으로 추정한다.

    Age: 햇수로 계산한 나이

    Outcome: 예측 목표 변수. 최초 측정 이후 5년 내 당뇨가 발병하면 값이 1이며, 반대로 미발병하면 0이다.

    신간 소식 구독하기
    뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.