이를 조금 어려운 말로 표현하면 수치형 데이터를 범주형 데이터로 변환하는 것이라고 말할 수 있습니다. 이와 같이 몇 번째라는 식으로 알려주면 인공지능은 더 높은 성능으로 분류할 수 있습니다. 그래서 예측이 아닌 분류 문제에서는 대부분 정답 레이블을 첫 번째, 두 번째, 세 번째와 같이 순서로 나타내도록 데이터의 형태를 바꿉니다. 이때 사용하는 방법이 바로 원-핫 인코딩(one-hot incoding)입니다.
Y_train = to_categorical(y_train, 10) Y_test = to_categorical(y_test, 10) print("Y Training matrix shape", Y_train.shape) print("Y Testing matrix shape", Y_test.shape)
실행 결과
Y Training matrix shape (60000, 10) Y Testing matrix shape (10000, 10)