더북(TheBook)

7.7 RNN, LSTM, GRU 성능 비교

앞서 구현했던 모델들의 정확도 및 수행 시간을 정리하면 다음 표와 같습니다.

▼ 표 7-1 모델 여섯 개에 대한 평가

구분

RNN 셀

RNN 계층

LSTM 셀

LSTM 계층

GRU 셀

GRU 계층

훈련 데이터

정확도

99%

96%

94%

96%

95%

94%

오차

0.03

0.1

0.2

0.1

0.1

0.2

테스트 데이터

정확도

80%

82%

82%

83%

83%

83%

오차

0.7

0.5

0.4

0.4

0.4

0.4

수행 시간

40

69

235

662

158

162

RNN 셀의 훈련 데이터셋에 대한 정확도가 가장 높으나, 검증 데이터셋에 대한 정확도는 다른 모델에 비해 조금 낮습니다. 훈련 데이터셋과 테스트 데이터셋의 정확도 및 수행 시간을 모두 고려한다면 RNN 계층의 성능이 가장 좋다고 할 수도 있겠습니다(물론 수행 시간이 중요하지 않다고 판단할 때는 GRU를 선택할 수도 있습니다).

하지만 모델 여섯 개에 대한 정확도 차이가 크지 않기 때문에 모든 모델을 실행하여 하이퍼파라미터 값을 제일 빨리 찾는 모델을 사용하길 권장합니다.