더북(TheBook)

형태소 분석(morphological analysis)은 단어를 더 작은 의미 단위인 형태소(morpheme)로 나누는 과정입니다. 형태소는 언어에서 의미를 갖는 최소 단위로, 어근(root)과 접사(접두사, 접미사), 굴절(inflection), 어미 등을 포함합니다. 형태소 분석이 완료되면, 나누어진 형태소에 해당하는 품사를 부여하는 품사 태깅(part-of-speech tagging) 작업을 수행합니다. 예를 들어 입력 문장이 “나는 학교에 갔다”일 경우 형태소 분석 결과는 다음과 같습니다.

▼ 표 1-3 형태소 분석 결과

형태소

품사 태그

설명

대명사

일인칭 대명사

보조사

화제를 나타내는 조사

학교

명사

일반 명사(장소)

부사격 조사

장소를 나타내는 조사

동사 어간

동사 ‘가다’의 어간

선어말 어미

과거 시제를 나타내는 선어말 어미

어말 어미

평서형 종결 어미

이 과정은 문장의 문법적 구조를 분석하고, 이후의 의미 해석이나 구문 분석과 같은 고차원 작업의 기초 단계로 활용됩니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.