이번에는 불용어를 제거한 카운터 벡터를 확인해 보겠습니다.
코드 10-4 불용어를 제거한 카운터 벡터
vect = CountVectorizer(stop_words=["and", "is", "please", "this"]).fit(corpus) ------ stop_words를 사용하여 is, an 같은 불용어 제거
vect.vocabulary_
불용어를 제거한 카운터 벡터가 다음과 같이 출력됩니다.
{'last': 6, 'chance': 1, 'if': 5, 'you': 11, 'do': 2, 'not': 8, 'have': 4, 'will': 10, 'never': 7, 'get': 3, 'any': 0, 'one': 9}