더북(TheBook)

9.1 단어 목록 읽어 들이기

이 장에서는 연습을 위해 영어 단어 목록이 필요하다. 웹에는 사용할 수 있는 단어 목록이 많지만, 우리의 용도에 가장 적합한 단어 목록은 Moby 어휘집(lexion) 프로젝트의 일부로 그래디 워드(Grady Ward)가 수집하고 공공재(public domain, 저작권이 소멸된 저작물)로 내놓은 단어 목록이다(자세한 것은 https://en.wikipedia.org/wiki/Moby_Project를 참조). 여기에는 113,809개의 공식 십자말풀이(crossword) 단어 목록이 있다. 이들 단어 목록은 십자말풀이나 다른 단어 게임에서 유효한 것으로 간주된다. Moby 컬렉션에는 113809of.fic라는 파일이 있다. 이 파일을 http://thinkpython2.com/code/words.txt에서 words.txt 같은 간단한 이름으로 내려받을 수 있다.

words.txt 파일은 텍스트 파일이므로 어떤 텍스트 에디터로도 열 수 있으며 파이썬에서도 바로 읽을 수 있다. 내장 함수 open은 인자로 파일 이름을 받고, 파일을 읽을 때 사용할 수 있는 파일 객체(file object)를 반환한다.

>>> fin = open('words.txt')

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.