다음은 전체 파라미터와 학습 가능한 파라미터 수입니다. 책에서는 CPU를 사용했지만 앞에서 GPU가 정상적으로 설치되었다면 ‘Computation device’에서 gpu가 출력될 것입니다.
Computation device: cpu 25,557,032 total parameters. 25,557,032 training parameters.
출력 결과 CPU를 사용할 것이며 전체 파라미터와 학습 가능한 파라미터는 25,557,032개라는 것을 보여 줍니다.
초기 학습률, 에포크 및 옵티마이저와 손실 함수를 지정합니다.
코드 8-28 옵티마이저와 손실 함수 지정
lr = 0.001
epochs = 100
optimizer = optim.Adam(model.parameters(), lr=lr)
criterion = nn.CrossEntropyLoss()
'--lr-scheduler' 또는 '--early-stopping'처럼 어떤 인수도 사용하지 않을 때 오차, 정확도 및 모델의 이름으로 사용할 문자열을 지정합니다.
코드 8-29 오차, 정확도 및 모델의 이름에 대한 문자열
loss_plot_name = 'loss' ------ 오차 출력에 대한 문자열
acc_plot_name = 'accuracy' ------ 정확도 출력에 대한 문자열
model_name = 'model' ------ 모델을 저장하기 위한 문자열