더북(TheBook)

3 원‐핫 인코딩

 

이제 케라스를 이용해 아이리스의 품종을 예측해 보겠습니다. Iris-setosa, Iris-virginica 등 데이터 안에 문자열이 포함되어 있네요. 먼저 조금 전 불러온 데이터 프레임을 Xy로 나누겠습니다.

X = df.iloc[:,0:4]
y = df.iloc[:,4]

Xy의 첫 다섯 줄을 출력해 보겠습니다.

print(X[0:5])
print(y[0:5])

실행 결과

   sepal_length  sepal_width  petal_length  petal_width
0           5.1          3.5           1.4          0.2
1           4.9          3.0           1.4          0.2
2           4.7          3.2           1.3          0.2
3           4.6          3.1           1.5          0.2
4           5.0          3.6           1.4          0.2
0    Iris-setosa
1    Iris-setosa
2    Iris-setosa
3    Iris-setosa
4    Iris-setosa
Name: species, dtype: object
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.