더북(TheBook)

from tensorflow.keras.utils import to_categorical

유틸 도구(utils) 중 to_categorical 함수를 불러오는 명령어입니다. 우리가 만들 인공지능 모델은 0부터 9 사이에 있는 숫자 이미지를 구별하는 인공지능입니다. 이때 이미지를 잘 학습시키기 위한 방법 중 하나로 원-핫 인코딩을 사용하는데, 원-핫 인코딩을 구현할 수 있는 함수가 바로 to_categorical 함수입니다.


원-핫 인코딩이란 무엇인가요?

원-핫 인코딩(one-hot incoding)이란 하나의 값만 1로 나타내고, 나머지 값은 모두 0으로 표시하는 방법입니다. 예를 들어 살펴볼까요?

mnist 데이터의 각 이미지가 나타내는 숫자는 0~9의 숫자 중 하나입니다. 원-핫 인코딩은 각 숫자를 0, 1, 2, 3… 같은 하나의 숫자로 나타내는 것이 아니라 벡터로 표현합니다. 즉, 숫자 0을 0이라고 나타내는 것이 아니라 [1, 0, 0, 0, 0, 0, 0, 0, 0, 0]으로 나타내는 것이죠. 이렇게 표현하면 숫자 0은 첫 번째에 해당하는 값이라는 것을 알려줄 수 있습니다. 마찬가지로 9의 경우에는 열 번째에 해당하는 숫자이기 때문에 [0, 0, 0, 0, 0, 0, 0, 0, 0, 1]로 나타낼 수 있습니다. 원-핫 인코딩은 16.4절(196쪽)에서 자세히 설명하겠습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.