더북(TheBook)

결과를 보면 중복된 단어도 빈도수에 포함되는 것을 알 수 있다. 문장 안에서 중복된 단어는 제외하고 단어의 수를 세고 싶다면 리스트로 변환된 값에 집합 자료형인 set()를 적용하면 된다. 위 예시에 적용한 뒤 다시 len()으로 세어 보면 중복된 단어는 제외하고 유일값(unique)에 대한 빈도수가 나오는 것을 볼 수 있다.

# 중복된 단어를 제외하는 단어의 빈도수
len(set("서울 강서구 서울 국립국어원".split()))

실행 결과

3
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.