워드 클라우드를 사용할 때는 특정 텍스트 집합을 잘 표현할 수 있는 단어들만 간추리고 싶기 때문에 보통 텍스트의 불용어(Stopwords) 집합을 제거한 뒤 사용합니다. 텍스트에 공통적으로 빈번하게 등장하는 단어들을 제거하지 않으면 우리가 원하는 의미 있는 단어들을 확인할 수 없기 때문입니다.
Note ≣ | 불용어(Stopwords)5란?
텍스트 분석에 의미적으로 굳이 있을 필요가 없는, 예를 들면 a, the 같은 관사나 대명사 같은 단어를 말합니다. 자주 등장하는 단어들이지만 내포하는 의미가 거의 없기 때문에 일반적으로 메모리 절감을 위해 제거하는 편입니다.