더북(TheBook)

희소 행렬로 출력됐다는 메시지가 나왔다. 앞에서와 마찬가지로 get_feature_names_out()을 사용해 dtm 변수에 쓰인 단어-문서 행렬에 등장하는 순서대로 단어 사전을 반환해 보자.

vocab = cvect.get_feature_names_out()
df_dtm = pd.DataFrame(dtm.toarray(), columns=vocab)
df_dtm

실행 결과

 

거리두기와

거리두기와 코로나

문의입니다

상생지원금

상생지원금 문의입니다

승강장

승강장 문의입니다

요금

요금 문의입니다

운행시간과

운행시간과 지하철

지하철

지하철 승강장

지하철 요금

지하철 운행시간과

코로나

코로나 거리두기와

코로나 상생지원금

택시

택시 승강장

0

1

1

1

1

1

0

0

0

0

0

0

0

0

0

0

2

1

1

0

0

1

0

0

1

0

0

0

0

1

1

1

1

2

0

1

1

0

0

0

0

0

2

0

0

1

0

0

1

1

0

0

0

0

1

1

0

0

0

0

0

0

0

3

0

0

1

0

0

1

1

0

0

0

0

0

0

0

0

0

0

0

1

1

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.