5 명사만 추출해 시각화
데이터 특성을 반영한 핵심 의미를 한눈에 보기 어려운 단어들이 먼저 보인다면, soynlp에서 제공하는 명사 추출기인 ‘LRNounExtractor’를 통해 명사만 추출할 수 있다.10
from soynlp.noun import LRNounExtractor
train() 함수는 WordExtractor로 단어를 미리 추출하고, 이 중에서 명사를 판단하는 과정을 진행한다.
%%time noun_extractor = LRNounExtractor(verbose=True) noun_extractor.train(content_text) nouns = noun_extractor.extract()
실행 결과
[Noun Extractor] used default noun predictor; Sejong corpus predictor [Noun Extractor] used noun_predictor_sejong [Noun Extractor] All 2398 r features was loaded [Noun Extractor] scanning was done (L,R) has (149911, 73537) tokens [Noun Extractor] building L-R graph was done [Noun Extractor] 25598 nouns are extracted