더북(TheBook)

이제 KoNLPy를 사용해 품사를 태깅해 볼 텐데 비교적 시간이 오래 걸리는 작업이다. 이럴 때 앞에서 설치했던 tqdm을 사용하면 작업 진행 상태를 확인할 수 있다. 또한, 속도 비교도 할 수 있다. 그림 5-4는 품사 태깅에 사용하는 형태소 분석기를 비교한 것으로, 10만 문자의 문서에 대해 각 클래스의 pos 메서드를 실행하는 데 소요되는 시간이다. Mecab과 Okt 순으로 속도가 빠르다.

 

그림 5-4 | KoNLPy 품사 태깅 클래스 간 비교 그래프4

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.