6.1.3 비지도 학습의 활용 사례
비지도 학습은 데이터를 더 자세히 이해하고 구조화하는 데 유용합니다. 마케팅 세분화(marketing segmentation), 사기 탐지(fraud detection), 장바구니 분석(market basket analysis) 등에 비지도 학습을 널리 사용합니다. 몇 가지 사례를 살펴봅시다.
음성 분류
음성 파일에 담긴 목소리를 분류하는 데 비지도 학습을 사용할 수 있습니다. 각 개인의 음성은 분류할 수 있을 정도로 독창적인 패턴이 있다는 점을 이용해 음성을 분류합니다. 예를 들어, 구글 홈(Google Home)은 음성 분류 기술을 이용해 서로 다른 사람의 음성을 구분하도록 훈련할 수 있습니다. 훈련이 끝나면 구글 홈은 개별 사용자의 요청을 분리해서 처리할 수 있습니다.
예를 들어 보겠습니다. 30분 동안 3명의 사람들이 나눈 대화 녹음 데이터가 있다고 합시다. 비지도 학습으로 이 데이터에 담긴 사람들의 목소리를 식별할 수 있습니다. 앞에서 설명한 것처럼 비지도 학습은 주어진 비정형 데이터에 구조를 부여할 수 있습니다. 이 구조는 우리가 가진 문제 공간에 쓸모 있는 새로운 차원을 추가합니다. 덕분에 우리는 문제에 대한 인사이트를 얻을 수 있고, 우리가 선택한 머신러닝 알고리즘에 필요한 데이터를 준비할 수 있습니다. 다음은 비지도 학습을 이용한 음성 분류의 예입니다.
▲ 그림 6-3 비지도 학습을 이용한 음성 분류
이 사례에서는 비지도 학습으로 세 가지 새로운 특성이 추가되는 셈입니다.