2 학습/시험 데이터 세트 분리하기
위 과정에서 문제가 발견되지 않는다면 학습 데이터 세트와 시험 데이터 세트로 분리한다. 먼저 정답 레이블(label)값을 설정한다.
label_name = "분류"
이어서 독립 변수(X, 문제)와 종속 변수(y, 정답)를 나눠 학습 데이터 세트와 시험 데이터 세트로 분리한다.
X = df["문서"] y = df[label_name]
위 과정에서 문제가 발견되지 않는다면 학습 데이터 세트와 시험 데이터 세트로 분리한다. 먼저 정답 레이블(label)값을 설정한다.
label_name = "분류"
이어서 독립 변수(X, 문제)와 종속 변수(y, 정답)를 나눠 학습 데이터 세트와 시험 데이터 세트로 분리한다.
X = df["문서"] y = df[label_name]