4 텍스트를 읽고 긍정, 부정 예측하기
실습해 볼 과제는 영화를 보고 남긴 리뷰를 딥러닝 모델로 학습해서 각 리뷰가 긍정적인지 부정적인지를 예측하는 것입니다.
먼저 짧은 리뷰 열 개를 불러와 각각 긍정이면 1이라는 클래스를, 부정적이면 0이라는 클래스로 지정합니다.
# 텍스트 리뷰 자료를 지정합니다. = ['너무 재밌네요','최고예요','참 잘 만든 영화예요','추천하고 싶은 영화입니다.','한 번 더 보고싶네요','글쎄요','별로예요','생각보다 지루하네요','연기가 어색해요','재미없어요'] # 긍정 리뷰는 1, 부정 리뷰는 0으로 클래스를 지정합니다. class = array([1,1,1,1,1,0,0,0,0,0])
그다음 앞서 배운 토큰화 과정을 진행합니다. 케라스에서 제공하는 Tokenizer() 함수의 fit_on_texts를 이용해 각 단어를 하나의 토큰으로 변환합니다.
# 토큰화 = Tokenizer() .fit_on_texts( ) print( .word_index) # 토큰화된 결과를 출력해 확인합니다.