NLTK는 아나콘다가 설치되어 있다면 추가적으로 설치할 필요가 없지만, 책에서는 가상 환경에서 실습하므로 다음 명령으로 설치합니다.
> pip install nltk
품사 태깅을 위해 주어진 문장에 대해 토큰화를 먼저 진행합니다. 다음 코드를 실행하면 NLTK Downloader 창이 뜹니다. Download를 눌러 내려받습니다.
코드 9-1 문장 토큰화
import nltk
nltk.download()
text = nltk.word_tokenize("Is it possible distinguishing cats and dogs")
text
Note ≡ NLTK Downloader
주피터 노트북에서 nltk.download() 코드를 실행하면 다음과 같이 NLTK Downloader 창이 뜹니다(윈도에서는 작업 표시줄에 표시로 나타납니다). 왼쪽 하단의 Download를 눌러야 관련 패키지 등을 내려받을 수 있습니다.
내려받기가 완료된 후에는 File > Exit를 선택해야 다음 단계를 진행할 수 있습니다.
▲ 그림 9-5 NLTK 다운로드