6.5 활용 사례 - 비슷한 트윗끼리 클러스터링하기
비지도 학습은 실시간으로 비슷한 트윗끼리 묶는 데 사용할 수 있습니다. 그 과정은 다음과 같습니다.
• 1단계 - 토픽 모델링: 주어진 트윗 집합에서 여러 주제를 도출합니다.
• 2단계 - 클러스터링: 앞서 도출한 주제를 트윗에 연결 짓습니다.
이를 그림으로 표현하면 다음과 같습니다.
▲ 그림 6-14 비지도 학습을 통한 주제별 트윗 분류
주의 ≡
이 사례에서는 트윗을 실시간으로 처리해야 합니다.
앞서 소개한 과정을 하나씩 자세히 살펴봅시다.