딥러닝 파이토치 교과서: 10.2.2 버트(BERT)

코드 10-48 모델의 파라미터(옵티마이저) 미세 조정 및 모델 훈련

optimizer = optim.Adam(model.parameters(), lr=2e-5) ------ 아담 옵티마이저와 적절한 학습률(2e-5)로 버트 모델을 미세 조정합니다.
train(model=model, optimizer=optimizer) ------ 모델을 학습시킵니다.

다음은 모델의 학습 결과입니다.

Epoch [1/5], Step [510/5100], Train Loss: 0.7124, Valid Loss: 0.6968
Model saved to ==> e:/torch/chap10/data/model.pt
Model saved to ==> e:/torch/chap10/data/metrics.pt
Epoch [1/5], Step [1020/5100], Train Loss: 0.7127, Valid Loss: 0.6970
Epoch [2/5], Step [1530/5100], Train Loss: 0.7067, Valid Loss: 0.6943
Model saved to ==> e:/torch/chap10/data/model.pt
Model saved to ==> e:/torch/chap10/data/metrics.pt
Epoch [2/5], Step [2040/5100], Train Loss: 0.7023, Valid Loss: 0.7232
Epoch [3/5], Step [2550/5100], Train Loss: 0.7059, Valid Loss: 0.6932
Model saved to ==> e:/torch/chap10/data/model.pt
Model saved to ==> e:/torch/chap10/data/metrics.pt
Epoch [3/5], Step [3060/5100], Train Loss: 0.6999, Valid Loss: 0.6927
Model saved to ==> e:/torch/chap10/data/model.pt
Model saved to ==> e:/torch/chap10/data/metrics.pt
Epoch [4/5], Step [3570/5100], Train Loss: 0.7023, Valid Loss: 0.6943
Epoch [4/5], Step [4080/5100], Train Loss: 0.6990, Valid Loss: 0.6928
Epoch [5/5], Step [4590/5100], Train Loss: 0.7005, Valid Loss: 0.6928
Epoch [5/5], Step [5100/5100], Train Loss: 0.6984, Valid Loss: 0.6968
Model saved to ==> ../chap10/data/metrics.pt
훈련 종료!

학습 결과는 훈련과 검증 데이터셋의 오차를 보여 주는데, 훈련이 진행될수록 훈련 데이터셋의 오차는 감소하고 있지만 검증 데이터셋에 대한 오차는 일정하지 않게 나타나고 있습니다.

신간 소식 구독하기

뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.