더북(TheBook)

LESSON 03
순환 신경망으로 텍스트 분류하기

순환 신경망(Recurrent neural network, RNN)은 이름에서 알 수 있듯이 신경망을 사용해 모델링한다. 순환 신경망의 가장 큰 특징은 이전 단어가 다음 단어에 의존 관계를 지닐 수 있도록 시퀀스 형태로 입력된다는 것이다.

 

(1) 나는 가방을 들고 (  )에 간다

(2) 나는 숟가락으로 (  )을 먹는다

 

위 두 문장이 있을 때 (1)번 괄호에 올 수 있는 단어는 한정적이다. (1)번 괄호에 밥이 들어오는 코퍼스는 없기 때문이다. 이렇게 연쇄된 문장의 맥락 정보를 담을 수 있다는 점이 RNN의 가장 큰 장점이다.

RNN은 모델 아키텍처가 그래프의 형태를 지니는데, 장단기 메모리(Long Short-Term Memory, LSTM)와 이를 더 단순화한 모델인 게이트 순환 유닛(Gated Recurrent Unit, GRU)이 있다. 단순화했다고 하는 이유는, LSTM에는 출력, 입력, 삭제 게이트가 있지만, GRU는 업데이트 게이트와 리셋 게이트만으로 동작하기 때문이다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.