딥러닝 텐서플로 교과서: 10.3 한국어 임베딩

앞서 생성한 함수를 사용하여 ‘과일’을 입력했을 때 이후에 등장하는 단어 두 개를 예측해 보겠습니다.

코드 10-70 ‘과일’ 이후의 예측 단어

print(sentGen(model, tok, "과일", 2)) ------ ‘과일’ 뒤에 등장하는 단어 두 개를 예측

다음은 ‘과일’ 이후에 등장할 단어들의 실행 결과입니다. 네트워크가 랜덤으로 초기화되기 때문에 결과가 책과 다를 수 있습니다.

과일 사과 사과

어떤가요? 영어와 다르지 않다는 것을 확인할 수 있었습니다. 즉, 자연어 처리를 위한 임베딩 방법만 알고 있다면 언어와 상관없이 단어/문장에 대한 임베딩을 진행하며, 모델을 생성하고 훈련시킨 후 예측 및 분류를 수행할 수 있습니다.

지금까지 9~10장에 걸쳐 자연어 처리를 간단히 살펴보았습니다. 다음 장에서는 클러스터링을 배워 보겠습니다.

추천 도서와 신규 콘텐츠를 먼저 받아보세요