3 원‐핫 인코딩
이제 케라스를 이용해 아이리스의 품종을 예측해 보겠습니다. Iris-setosa, Iris-virginica 등 데이터 안에 문자열이 포함되어 있네요. 먼저 조금 전 불러온 데이터 프레임을 X와 y로 나누겠습니다.
X = df.iloc[:,0:4] = df.iloc[:,4]
X와 y의 첫 다섯 줄을 출력해 보겠습니다.
print(X[0:5]) print(y[0:5])
실행 결과
sepal_length sepal_width petal_length petal_width 0 5.1 3.5 1.4 0.2 1 4.9 3.0 1.4 0.2 2 4.7 3.2 1.3 0.2 3 4.6 3.1 1.5 0.2 4 5.0 3.6 1.4 0.2 0 Iris-setosa 1 Iris-setosa 2 Iris-setosa 3 Iris-setosa 4 Iris-setosa Name: species, dtype: object