더북(TheBook)

LESSON 08
단어 벡터화하기

이제 머신러닝에서 텍스트를 처리하는 방법에 대해 알아보자. 머신러닝이나 딥러닝 알고리즘은 문자를 이해할 수 없다. 따라서 인코딩 과정은 단어를 숫자로 바꿔 계산하는 과정이라고 볼 수 있다. 문자를 숫자로 변경해 주는 과정은 크게 다음과 같다.

 

그림 5-5 | 입력 문장의 인코딩 과정

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.