더북(TheBook)

재미 삼아 이 리뷰 데이터 하나를 원래 영어 단어로 어떻게 바꾸는지 보겠습니다.6

코드 4-2 리뷰를 다시 텍스트로 디코딩하기

word_index = imdb.get_word_index() 
reverse_word_index = dict(
    [(value, key) for (key, value) in word_index.items()])  
decoded_review = " ".join(
    [reverse_word_index.get(i - 3, "?") for i in train_data[0]]) 

word_index는 단어와 정수 인덱스를 매핑한 딕셔너리입니다.

정수 인덱스와 단어를 매핑하도록 뒤집습니다.

리뷰를 디코딩합니다. 0, 1, 2는 ‘패딩’, ‘문서 시작’, ‘사전에 없음’을 위해 예약되어 있으므로 인덱스에서 3을 뺍니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.