더북(TheBook)

이번에는 문장을 형태소로 변환한 후 품사를 태깅해 보겠습니다.

코드 9-7 품사 태깅

print(komoran.pos('소파 위에 있는 것이 고양이인가요? 강아지인가요?')) ------ 텍스트에서 품사를 태깅하여 반환

다음은 문장을 형태로 분해하여 품사를 태깅한 출력 결과입니다.

[('소파', 'NNP'), ('위', 'NNG'), ('에', 'JKB'), ('있', 'VV'), ('는', 'ETM'), ('것', 'NNB'), ('이', 'JKS'), ('고양이', 'NNG'), ('이', 'VCP'), ('ㄴ가요', 'EF'), ('?', 'SF'), ('강아지', 'NNG'), ('이', 'VCP'), ('ㄴ가요', 'EF'), ('?', 'SF')]

참고로 KoNLPy에서 제공하는 주요 기능은 다음과 같습니다.

형태소 분석

품사 태깅

Note ≡ 형태소


형태소는 언어를 쪼갤 때 의미를 가지는 최소 단위입니다. 다음 그림은 형태소 분석을 위한 단계를 도식화한 것입니다.

▲ 그림 9-16 형태소

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.