7.7 RNN, LSTM, GRU 성능 비교
앞서 구현했던 모델들의 정확도 및 수행 시간을 정리하면 다음 표와 같습니다.
▼ 표 7-1 모델 여섯 개에 대한 평가
구분 |
RNN 셀 |
RNN 계층 |
LSTM 셀 |
LSTM 계층 |
GRU 셀 |
GRU 계층 |
|
훈련 데이터 |
정확도 |
99% |
96% |
94% |
96% |
95% |
94% |
오차 |
0.03 |
0.1 |
0.2 |
0.1 |
0.1 |
0.2 |
|
테스트 데이터 |
정확도 |
80% |
82% |
82% |
83% |
83% |
83% |
오차 |
0.7 |
0.5 |
0.4 |
0.4 |
0.4 |
0.4 |
|
수행 시간 |
40 |
69 |
235 |
662 |
158 |
162 |
RNN 셀의 훈련 데이터셋에 대한 정확도가 가장 높으나, 검증 데이터셋에 대한 정확도는 다른 모델에 비해 조금 낮습니다. 훈련 데이터셋과 테스트 데이터셋의 정확도 및 수행 시간을 모두 고려한다면 RNN 계층의 성능이 가장 좋다고 할 수도 있겠습니다(물론 수행 시간이 중요하지 않다고 판단할 때는 GRU를 선택할 수도 있습니다).
하지만 모델 여섯 개에 대한 정확도 차이가 크지 않기 때문에 모든 모델을 실행하여 하이퍼파라미터 값을 제일 빨리 찾는 모델을 사용하길 권장합니다.