모두의 한국어 텍스트 분석 with 파이썬: 3 n-gram: 앞뒤 단어 묶어서 사용

희소 행렬로 출력됐다는 메시지가 나왔다. 앞에서와 마찬가지로 get_feature_names_out()을 사용해 dtm 변수에 쓰인 단어-문서 행렬에 등장하는 순서대로 단어 사전을 반환해 보자.

vocab = cvect.get_feature_names_out()
df_dtm = pd.DataFrame(dtm.toarray(), columns=vocab)
df_dtm

실행 결과

신간 소식 구독하기

뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.