딥러닝 텐서플로 교과서: 7.7 RNN, LSTM, GRU 성능 비교

7.7 RNN, LSTM, GRU 성능 비교

앞서 구현했던 모델들의 정확도 및 수행 시간을 정리하면 다음 표와 같습니다.

▼ 표 7-1 모델 여섯 개에 대한 평가

구분		RNN 셀	RNN 계층	LSTM 셀	LSTM 계층	GRU 셀	GRU 계층
훈련 데이터	정확도	99%	96%	94%	96%	95%	94%
훈련 데이터	오차	0.03	0.1	0.2	0.1	0.1	0.2
테스트 데이터	정확도	80%	82%	82%	83%	83%	83%
테스트 데이터	오차	0.7	0.5	0.4	0.4	0.4	0.4
수행 시간		40	69	235	662	158	162

RNN 셀의 훈련 데이터셋에 대한 정확도가 가장 높으나, 검증 데이터셋에 대한 정확도는 다른 모델에 비해 조금 낮습니다. 훈련 데이터셋과 테스트 데이터셋의 정확도 및 수행 시간을 모두 고려한다면 RNN 계층의 성능이 가장 좋다고 할 수도 있겠습니다(물론 수행 시간이 중요하지 않다고 판단할 때는 GRU를 선택할 수도 있습니다).

하지만 모델 여섯 개에 대한 정확도 차이가 크지 않기 때문에 모든 모델을 실행하여 하이퍼파라미터 값을 제일 빨리 찾는 모델을 사용하길 권장합니다.

신간 소식 구독하기

뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.