결과를 보면 중복된 단어도 빈도수에 포함되는 것을 알 수 있다. 문장 안에서 중복된 단어는 제외하고 단어의 수를 세고 싶다면 리스트로 변환된 값에 집합 자료형인 set()를 적용하면 된다. 위 예시에 적용한 뒤 다시 len()으로 세어 보면 중복된 단어는 제외하고 유일값(unique)에 대한 빈도수가 나오는 것을 볼 수 있다.
# 중복된 단어를 제외하는 단어의 빈도수 len(set("서울 강서구 서울 국립국어원".split()))
실행 결과
3