더북(TheBook)

문서 분류

비지도 학습은 비정형 텍스트 데이터에도 적용할 수 있습니다. PDF 문서 데이터셋에 비지도 학습을 이용해 다음과 같은 작업을 수행할 수 있습니다.

데이터셋에 담긴 여러 주제 발굴하기

각 PDF 문서를 발굴한 주제에 연결 짓기

비지도 학습을 이용한 문서 분류 절차는 다음 그림과 같습니다. 이는 비정형 데이터에 구조를 추가하는 또 다른 사례입니다.

▲ 그림 6-4 비지도 학습을 이용한 문서 분류

이 사례에서는 비지도 학습으로 5개의 새로운 특성을 추가합니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.