그러면 임의의 두 단어는 서로 얼마나 가까울까? ‘dog’와 ‘cat’의 모든 synset을 살펴보고, 가장 의미론적으로 가까운 정의를 찾아보자.
[simxy.definition() for simxy in max(
(x.path_similarity(y), x, y)
for x in wn.synsets('cat')
for y in wn.synsets('dog')
if x.path_similarity(y) # synset들이 서로 관련 있는지 확인한다.
)[1:]]
>>>
['an informal term for a youth or man', 'informal term for a man']
짜잔! 기본적인 코퍼스 외에도 PlaintextCorpusReader로 여러분만의 코퍼스를 만들 수 있다. 리더는 root 디렉터리 경로에서 glob 패턴과 일치하는 파일을 찾는다.
myCorpus = nltk.corpus.PlaintextCorpusReader(root, glob)