문서 분류
비지도 학습은 비정형 텍스트 데이터에도 적용할 수 있습니다. PDF 문서 데이터셋에 비지도 학습을 이용해 다음과 같은 작업을 수행할 수 있습니다.
• 데이터셋에 담긴 여러 주제 발굴하기
• 각 PDF 문서를 발굴한 주제에 연결 짓기
비지도 학습을 이용한 문서 분류 절차는 다음 그림과 같습니다. 이는 비정형 데이터에 구조를 추가하는 또 다른 사례입니다.
▲ 그림 6-4 비지도 학습을 이용한 문서 분류
이 사례에서는 비지도 학습으로 5개의 새로운 특성을 추가합니다.