더북(TheBook)

13.1 단어 빈도 분석

연습문제 13-1

파일을 읽어서 단어들을 각 줄로 나누고, 단어에서 공백과 구두점을 제거하고, 모든 단어를 소문자로 변환하는 프로그램을 작성하라.

힌트: string 모듈에 공백, 탭, 줄바꿈 등을 담은 문자열을 whitespace로 제공하며, 구두점에 사용하는 문자들을 담은 punctuation을 제공한다. 파이썬에서 어떤 문자들인지 살펴보자.

>>> import string

>>> string.punctuation

'!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~'

또한, 문자열 메서드 strip, replace, translate를 사용할 수 있다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.