더북(TheBook)

LESSON 02
잠재 디리클레 할당으로 토픽 분류하기

잠재 디리클레 할당(Latent Dirichlet Allocation, LDA)은 주어진 문서에 대해 각 문서에 어떤 주제(토픽)들이 있는지 서술하는 확률적 토픽 분류 기법 중 하나다.2 다시 말해 미리 알고 있는 주제별 단어 수 분포를 바탕으로, 주어진 문서에서 발견된 단어 수 분포를 분석함으로써 해당 문서가 어떤 주제들을 함께 다루고 있을지 예측한다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.