더북(TheBook)

6.5 활용 사례 - 비슷한 트윗끼리 클러스터링하기

비지도 학습은 실시간으로 비슷한 트윗끼리 묶는 데 사용할 수 있습니다. 그 과정은 다음과 같습니다.

1단계 - 토픽 모델링: 주어진 트윗 집합에서 여러 주제를 도출합니다.

2단계 - 클러스터링: 앞서 도출한 주제를 트윗에 연결 짓습니다.

이를 그림으로 표현하면 다음과 같습니다.

▲ 그림 6-14 비지도 학습을 통한 주제별 트윗 분류

주의 ≡

이 사례에서는 트윗을 실시간으로 처리해야 합니다.

앞서 소개한 과정을 하나씩 자세히 살펴봅시다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.