재미 삼아 이 리뷰 데이터 하나를 원래 영어 단어로 어떻게 바꾸는지 보겠습니다.6
코드 4-2 리뷰를 다시 텍스트로 디코딩하기
word_index = imdb.get_word_index() ➊
reverse_word_index = dict(
[(value, key) for (key, value) in word_index.items()]) ➋
decoded_review = " ".join(
[reverse_word_index.get(i - 3, "?") for i in train_data[0]]) ➌
➊ word_index는 단어와 정수 인덱스를 매핑한 딕셔너리입니다.
➋ 정수 인덱스와 단어를 매핑하도록 뒤집습니다.
➌ 리뷰를 디코딩합니다. 0, 1, 2는 ‘패딩’, ‘문서 시작’, ‘사전에 없음’을 위해 예약되어 있으므로 인덱스에서 3을 뺍니다.