■ 비지도 학습 사례 살펴보기1 - 군집화
정답이 없는 데이터를 사용하여 인공지능을 만드는 비지도 학습 방식으로 어떠한 인공지능을 만들 수 있을까요? 바로 데이터를 여러 그룹으로 묶는 군집화(clustering)를 할 수 있습니다. 그리고 데이터의 여러 특징들을 살펴보고, 가장 대표적인 특징만 뽑아내는 차원 축소를 할 수 있습니다(차원 축소는 뒤에서 설명합니다).
먼저 군집화를 살펴볼 텐데요. 인기 유튜브 콘텐츠를 보다 보면 종종 이런 댓글들을 보게 됩니다.
“알 수 없는 알고리즘이 나를 이곳으로 데려왔다.”
누군가 유튜브 추천 영상을 보고 단 댓글입니다. 유튜브뿐만 아니라 오늘날 추천 시스템(recommender system)은 다양한 곳에서 사용됩니다. 동영상 스트리밍 사이트인 넷플릭스나 인터넷 상거래 기업인 아마존 그리고 네이버나 카카오 같은 기업에서도 수요자에게 알맞은 콘텐츠를 제공하기 위해 다양한 알고리즘을 사용합니다.
그리고 이러한 알고리즘에 인공지능을 사용합니다. 물론 각 기업에서 어떠한 인공지능 알고리즘을 사용하는지 구체적으로 밝히지는 않았지만, 사람들의 특징을 구분할 때 비지도 학습을 주로 사용합니다.
앞에서 비지도 학습은 정답이 없는 데이터를 사용하는 방법이라고 하였습니다. 세상의 다양한 데이터에는 정답이 있는 데이터보다 정답이 없는 데이터가 많기 때문에 이러한 데이터를 적절하게 사용하는 것이 중요합니다.
다양한 사람들이 물건들을 구매한 내역을 보고 그 사람들을 여러 그룹으로 만들 수 있습니다. 이때 그룹을 만드는 기준을 사람이 알고리즘을 만들어서 나눌 수 있지만, 비지도 학습을 사용하면 데이터의 특징으로 스스로 판단해서 몇 개의 그룹으로 나눌 수 있습니다.