더북(TheBook)

9장

 

1 AttributeError: module 'tweepy' has no attribute 'StreamListener' 같은 오류가 발생한다면 tweepy 버전이 4.0.0으로 업그레이드되었기 때문입니다. 다음 명령을 아나콘다 프롬프트에서 설치한 후 커널을 재시작하면 정상적으로 실행됩니다.

 

> pip install tweepy==3.10.0

 

2 워드투벡터는 10장에서 자세히 다룹니다.

 

3 문서 집합의 추상적인 주제를 발견하기 위한 통계적 모델 중 하나로, 텍스트 본문의 숨겨진 의미 구조를 발견하는 데 사용되는 텍스트 마이닝 기법입니다. 한마디로 각 주제별로 단어 표현을 묶어 주는 것입니다.

 

4 주어진 문서에 대해 각 문서에 어떤 주제들이 존재하는지를 서술하는 확률적 토픽 모델 기법입니다.

 

5 The mini-MIAS database of mammograms(http://peipa.essex.ac.uk/info/mias.html)에서 제공하는 유방 조영술 관련 데이터셋을 수정하여 사용합니다.

 

6 https://github.com/e9t/nsmc에 오픈된 데이터 중 하나입니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.