더북(TheBook)

그러면 임의의 두 단어는 서로 얼마나 가까울까? ‘dog’와 ‘cat’의 모든 synset을 살펴보고, 가장 의미론적으로 가까운 정의를 찾아보자.


[simxy.definition() for simxy in max(

  (x.path_similarity(y), x, y)

  for x in wn.synsets('cat')

  for y in wn.synsets('dog')

  if x.path_similarity(y) # synset들이 서로 관련 있는지 확인한다.

)[1:]]

>>>

['an informal term for a youth or man', 'informal term for a man']


짜잔! 기본적인 코퍼스 외에도 PlaintextCorpusReader로 여러분만의 코퍼스를 만들 수 있다. 리더는 root 디렉터리 경로에서 glob 패턴과 일치하는 파일을 찾는다.


myCorpus = nltk.corpus.PlaintextCorpusReader(root, glob)


신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.