4.1.1 MNIST 데이터셋
이 장에서 다루는 컴퓨터 비전 문제는 MNIST7 손 글씨 숫자 데이터셋입니다. 이 데이터셋은 컴퓨터 비전과 딥러닝의 ‘헬로 월드(hello world)’로 불릴 만큼 중요하고 자주 사용됩니다. MNIST 데이터셋은 딥러닝에서 볼 수 있는 대부분의 데이터셋보다 오래되고 규모가 작습니다. 하지만 예제로 널리 사용되고 새로운 딥러닝 기술을 위한 첫 번째 테스트로 종종 사용되기 때문에 잘 알고 있는 것이 좋습니다.
MNIST 데이터셋의 각 샘플은 28 × 28 크기의 흑백 이미지입니다(그림 4-1 참조). 이 이미지는 0에서 9까지 열 개 숫자의 손 글씨를 변환한 것입니다. 보통의 컴퓨터 비전 문제에서 다루는 이미지 사이즈보다는 작지만, 28 × 28 크기는 숫자 같은 간단한 모양을 인식하는 데 충분합니다. 각 이미지는 열 개의 가능한 숫자 중에서 이미지가 실제로 어떤 것인지 나타내는 레이블이 함께 제공됩니다. 다운로드 시간 예측과 보스턴 주택 데이터셋에서 했던 것처럼 이 데이터셋을 훈련 세트와 테스트 세트로 나눕니다. 훈련 세트는 60,000개 이미지로 구성되고, 테스트 세트는 10,000개 이미지로 구성됩니다. MNIST 데이터셋8은 열 개의 범주(즉, 열 개의 숫자)에 대해 거의 동일한 개수의 샘플을 가지고 있어 균형을 이루고 있습니다.