생성형 AI 완전 정복: 1.2.4 생성형 AI 기술의 발전 -24

다음은 자연어 처리에서 수행되는 주요 작업에 대해 간단히 설명하겠습니다.

토큰화(tokenization)는 문자열(문장, 문서)에서 처리할 수 있는 최소 단위인 토큰(token)을 분리하는 과정입니다. 여기서 토큰은 보통 단어(word), 서브워드(subword), 글자(character) 등으로 나뉩니다.

▼ 표 1-2 토큰화 예시

신간 소식 구독하기

뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.