더북(TheBook)

① 로그 소프트맥스(log_softmax())는 신경망 말단의 결괏값들을 확률 개념으로 해석하기 위해 소프트맥스(softmax) 함수의 결과에 log 값을 취한 연산입니다. 소프트맥스를 사용하지 않고 로그 소프트맥스를 사용하는 이유는 소프트맥스는 기울기 소멸 문제(vanishing gradient problem)에 취약하기 때문입니다. 다음은 소프트맥스와 로그 소프트맥스에 대한 수식입니다.

앞에서 생성된 모델을 model = XAI()로 객체화한 후 장치(CPU 혹은 GPU)에 할당합니다.

코드 5-32 모델 객체화

model = XAI() ------ model이라는 이름의 객체를 생성
model.to(device) ------ model을 장치(CPU 혹은 GPU)에 할당
model.eval() ------ 테스트 데이터에 대한 모델 평가 용도로 사용
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.