3 원‐핫 인코딩

     

    이제 케라스를 이용해 아이리스의 품종을 예측해 보겠습니다. Iris-setosa, Iris-virginica 등 데이터 안에 문자열이 포함되어 있네요. 먼저 조금 전 불러온 데이터 프레임을 Xy로 나누겠습니다.

    X = df.iloc[:,0:4]
    y = df.iloc[:,4]

    Xy의 첫 다섯 줄을 출력해 보겠습니다.

    print(X[0:5])
    print(y[0:5])

    실행 결과

       sepal_length  sepal_width  petal_length  petal_width
    0           5.1          3.5           1.4          0.2
    1           4.9          3.0           1.4          0.2
    2           4.7          3.2           1.3          0.2
    3           4.6          3.1           1.5          0.2
    4           5.0          3.6           1.4          0.2
    0    Iris-setosa
    1    Iris-setosa
    2    Iris-setosa
    3    Iris-setosa
    4    Iris-setosa
    Name: species, dtype: object
    신간 소식 구독하기
    뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.