이번에는 문장을 형태소로 변환한 후 품사를 태깅해 보겠습니다.
코드 9-7 품사 태깅
print(komoran.pos('소파 위에 있는 것이 고양이인가요? 강아지인가요?')) ------ 텍스트에서 품사를 태깅하여 반환
다음은 문장을 형태로 분해하여 품사를 태깅한 출력 결과입니다.
[('소파', 'NNP'), ('위', 'NNG'), ('에', 'JKB'), ('있', 'VV'), ('는', 'ETM'), ('것', 'NNB'), ('이', 'JKS'), ('고양이', 'NNG'), ('이', 'VCP'), ('ㄴ가요', 'EF'), ('?', 'SF'), ('강아지', 'NNG'), ('이', 'VCP'), ('ㄴ가요', 'EF'), ('?', 'SF')]
참고로 KoNLPy에서 제공하는 주요 기능은 다음과 같습니다.
• 형태소 분석
• 품사 태깅
Note ≡ 형태소
형태소는 언어를 쪼갤 때 의미를 가지는 최소 단위입니다. 다음 그림은 형태소 분석을 위한 단계를 도식화한 것입니다.
▲ 그림 9-16 형태소