희소 행렬로 출력됐다는 메시지가 나왔다. 앞에서와 마찬가지로 get_feature_names_out()을 사용해 dtm 변수에 쓰인 단어-문서 행렬에 등장하는 순서대로 단어 사전을 반환해 보자.
vocab = cvect.get_feature_names_out() df_dtm = pd.DataFrame(dtm.toarray(), columns=vocab) df_dtm
실행 결과
|
거리두기와 |
거리두기와 코로나 |
문의입니다 |
상생지원금 |
상생지원금 문의입니다 |
승강장 |
승강장 문의입니다 |
요금 |
요금 문의입니다 |
운행시간과 |
운행시간과 지하철 |
지하철 |
지하철 승강장 |
지하철 요금 |
지하철 운행시간과 |
코로나 |
코로나 거리두기와 |
코로나 상생지원금 |
택시 |
택시 승강장 |
0 |
1 |
1 |
1 |
1 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
2 |
1 |
1 |
0 |
0 |
1 |
0 |
0 |
1 |
0 |
0 |
0 |
0 |
1 |
1 |
1 |
1 |
2 |
0 |
1 |
1 |
0 |
0 |
0 |
0 |
0 |
2 |
0 |
0 |
1 |
0 |
0 |
1 |
1 |
0 |
0 |
0 |
0 |
1 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
3 |
0 |
0 |
1 |
0 |
0 |
1 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
1 |
1 |