더북(TheBook)

앞에서 비지도 학습은 정답이 없는 데이터를 사용하는 방식이라고 했습니다. 세상의 다양한 데이터에는 정답이 있는 데이터보다 정답이 없는 데이터가 많기 때문에 이러한 데이터를 적절하게 사용하는 것이 중요합니다.

다양한 사람이 물건을 구매한 내역을 보고 그들을 여러 그룹으로 나눌 수 있습니다. 이때 그룹을 나누는 기준을 사람이 알고리즘을 만들어서 할 수도 있지만, 비지도 학습을 사용하면 데이터의 특징으로 스스로 판단해서 몇 개의 그룹으로 나눌 수 있습니다.

이와 같이 비지도 학습을 사용하면 데이터를 다양한 그룹으로 만들 수 있습니다. 이렇게 만들어진 그룹을 군집(cluster)이라고 합니다. 그리고 다양한 그룹으로 만드는 과정을 군집화라고 합니다.

그림 2-7 군집화 예

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.