생성형 AI 완전 정복: 1.2.4 생성형 AI 기술의 발전 -35

LSTM은 RNN에 비해 긴 문맥 의존성 문제를 훨씬 잘 처리해, 기계 번역, 음성 인식, 언어 모델링 등 다양한 시퀀스 처리 작업에서 성능 향상을 이끌었습니다. 다만, LSTM은 RNN에 비해 파라미터 수가 많고 계산량이 증가하며 구현 복잡성이 높다는 단점이 있었습니다. 이에 2014년 조경현과 그의 동료들은 LSTM과 유사한 성능을 보이면서 구조를 단순화한 모델을 제안했는데, 이것이 GRU입니다.

신간 소식 구독하기

뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.