더북(TheBook)

전체 단어 가방에서 해당 리뷰마다 등장하는 단어에 대한 빈도수를 head()를 통해 확인해 보자. 행은 각 리뷰를 의미하며, 등장하는 단어의 빈도수를 확인할 수 있다. 0은 등장하지 않는다는 뜻인데, 단어 가방으로 벡터화하면 희소한 행렬이 만들어지는 단점이 있다. 이 책에서는 지면상 생략되어 보이지 않지만 등장하는 단어는 빈도수가 표시된다.

pd.DataFrame(feature_vector[:10].toarray(), columns=vocab).head()

실행 결과

 

12개 만들면서 배우는

12개 만들면서 배우는 ios

12개 만들면서 배우는 ios 아이폰

12개 만들면서 배우는 ios 아이폰 개발

12개를 만들며 배우는

12개를 만들며 배우는 swift4

12개를 만들며 배우는 swift4 ios11

12개를 만들며 배우는 swift4 ios11 아이폰

2018 do it

2018 do it 안드로이드

...

활용2 api 개발과 성능 최적화

활용한 다양한 자동화

활용한 다양한 자동화 어플리케이션

활용한 다양한 자동화 어플리케이션 제작하기

활용한 데이터분석과 it보안

활용한 리액트 native

활용한 리액트 native 개발

활용한 메신져 만들기

활용한 메신져 만들기 android

활용한 파이썬 프로그래밍

0

0

0

0

0

0

0

0

0

0

0

...

0

0

0

0

0

0

0

0

0

0

1

0

0

0

0

0

0

0

0

0

0

...

0

0

0

0

0

0

0

0

0

0

2

0

0

0

0

0

0

0

0

0

0

...

0

0

0

0

0

0

0

0

0

0

3

0

0

0

0

0

0

0

0

0

0

...

0

0

0

0

0

0

0

0

0

0

4

0

0

0

0

0

0

0

0

0

0

...

0

0

0

0

0

0

0

0

0

0

5 rows × 2000 columns
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.