더북(TheBook)

7.5.1 LSTM 구조

LSTM 구조는 순전파와 역전파 과정으로 살펴보겠습니다.

 

LSTM 순전파

LSTM은 기울기 소멸 문제를 해결하기 위해 망각 게이트, 입력 게이트, 출력 게이트라는 새로운 요소를 은닉층의 각 뉴런에 추가했습니다.

그럼 LSTM에서 사용되는 각 게이트를 자세히 알아보겠습니다.

 

망각 게이트

망각 게이트(forget gate)는 과거 정보를 어느 정도 기억할지 결정합니다. 과거 정보와 현재 데이터를 입력받아 시그모이드를 취한 후 그 값을 과거 정보에 곱해 줍니다. 따라서 시그모이드의 출력이 0이면 과거 정보는 버리고, 1이면 과거 정보는 온전히 보존합니다.

0과 1 사이의 출력 값을 가지는 ht-1xt를 입력 값으로 받습니다. 이때 xt는 새로운 입력 값이고 ht-1은 이전 은닉층에서 입력되는 값입니다. 즉, ht-1xt를 이용하여 이전 상태 정보를 현재 메모리에 반영할지 결정하는 역할을 합니다.

계산한 값이 1이면 바로 직전의 정보를 메모리에 유지

계산한 값이 0이면 초기화

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.