전체 단어 가방에서 해당 리뷰마다 등장하는 단어에 대한 빈도수를 head()를 통해 확인해 보자. 행은 각 리뷰를 의미하며, 등장하는 단어의 빈도수를 확인할 수 있다. 0은 등장하지 않는다는 뜻인데, 단어 가방으로 벡터화하면 희소한 행렬이 만들어지는 단점이 있다. 이 책에서는 지면상 생략되어 보이지 않지만 등장하는 단어는 빈도수가 표시된다.
pd.DataFrame(feature_vector[:10].toarray(), columns=vocab).head()
실행 결과
|
12개 만들면서 배우는 |
12개 만들면서 배우는 ios |
12개 만들면서 배우는 ios 아이폰 |
12개 만들면서 배우는 ios 아이폰 개발 |
12개를 만들며 배우는 |
12개를 만들며 배우는 swift4 |
12개를 만들며 배우는 swift4 ios11 |
12개를 만들며 배우는 swift4 ios11 아이폰 |
2018 do it |
2018 do it 안드로이드 |
... |
활용2 api 개발과 성능 최적화 |
활용한 다양한 자동화 |
활용한 다양한 자동화 어플리케이션 |
활용한 다양한 자동화 어플리케이션 제작하기 |
활용한 데이터분석과 it보안 |
활용한 리액트 native |
활용한 리액트 native 개발 |
활용한 메신져 만들기 |
활용한 메신져 만들기 android |
활용한 파이썬 프로그래밍 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
... |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
... |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
2 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
... |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
3 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
... |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
4 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
... |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
5 rows × 2000 columns