■ print("y_train shape", y_train.shape)
print문을 사용하여 y_train 데이터의 형태를 출력하는 명령어입니다. y_train 데이터는 x_train 데이터의 정답이라고 생각하면 됩니다. x_train의 데이터 개수가 60,000개였으니 y_train 데이터 또한 60,000개겠죠? 실행 결과는 다음과 같습니다.
실행 결과
y_train shape (60000,)
데이터의 개수가 60,000개이며, 그 뒷부분에는 아무런 정보가 없습니다. 이렇게 콤마(,) 이후에 아무것도 나오지 않으면 이는 1차원 배열을 의미합니다.
실제 y_train 데이터를 살펴봅시다. 첫 번째 7은 x_train 중 1번째 데이터의 값이 무엇인지를 나타내고 있습니다.
그림 16-8 | y_train 데이터(정답)의 모습
TIP
첫 번째인데 인덱스 번호가 0인 이유는, 파이썬을 포함하여 대부분 프로그래밍 언어에서는 첫 번째를 1이 아닌 0으로 설정하기 때문입니다.
앞에서 살펴본 x_train의 첫 번째 데이터의 정답과 일치하네요. 이러한 데이터가 각각 60,000개가 있다고 보면 됩니다.