형태소 분석(morphological analysis)은 단어를 더 작은 의미 단위인 형태소(morpheme)로 나누는 과정입니다. 형태소는 언어에서 의미를 갖는 최소 단위로, 어근(root)과 접사(접두사, 접미사), 굴절(inflection), 어미 등을 포함합니다. 형태소 분석이 완료되면, 나누어진 형태소에 해당하는 품사를 부여하는 품사 태깅(part-of-speech tagging) 작업을 수행합니다. 예를 들어 입력 문장이 “나는 학교에 갔다”일 경우 형태소 분석 결과는 다음과 같습니다.
▼ 표 1-3 형태소 분석 결과
|
형태소 |
품사 태그 |
설명 |
|
나 |
대명사 |
일인칭 대명사 |
|
는 |
보조사 |
화제를 나타내는 조사 |
|
학교 |
명사 |
일반 명사(장소) |
|
에 |
부사격 조사 |
장소를 나타내는 조사 |
|
가 |
동사 어간 |
동사 ‘가다’의 어간 |
|
았 |
선어말 어미 |
과거 시제를 나타내는 선어말 어미 |
|
다 |
어말 어미 |
평서형 종결 어미 |
이 과정은 문장의 문법적 구조를 분석하고, 이후의 의미 해석이나 구문 분석과 같은 고차원 작업의 기초 단계로 활용됩니다.