라이브러리를 호출하고 데이터를 준비합니다. 사용할 digits 숫자 데이터셋은 사이킷런에서 제공하는 데이터셋입니다.
코드 3-16 라이브러리 호출 및 데이터 준비
%matplotlib inline
from sklearn.datasets import load_digits
digits = load_digits() ------ 숫자 데이터셋(digits)은 사이킷런에서 제공
print("Image Data Shape", digits.data.shape) ------ digits 데이터셋의 형태(이미지가 1797개 있으며, 8×8 이미지의 64차원을 가짐)
print("Label Data Shape", digits.target.shape) ------ 레이블(이미지의 숫자 정보) 이미지 1797개가 있음
코드를 실행하면 다음과 같이 digits 데이터셋 형태를 출력해서 보여 줍니다.
Image Data Shape (1797, 64) Label Data Shape (1797,)
digits 데이터셋의 이미지와 레이블이 어떻게 생겼는지 시각화해서 확인해 봅시다.
코드 3-17 digits 데이터셋의 시각화
import numpy as np
import matplotlib.pyplot as plt
plt.figure(figsize=(20,4))
for index, (image, label) in enumerate(zip(digits.data[0:5], digits.target[0:5])): ------ 예시로 이미지 다섯 개만 확인
plt.subplot(1, 5, index+1)
plt.imshow(np.reshape(image, (8,8)), cmap=plt.cm.gray)
plt.title('Training: %i\n' % label, fontsize=20)