더북(TheBook)

3.2.2 밀도 기반 군집 분석

▼ 표 3-12 밀도 기반 군집 분석을 사용하는 이유와 적용 환경

왜 사용할까?

주어진 데이터에 대한 군집화

언제 사용하면 좋을까?

K-평균 군집화와는 다르게 사전에 클러스터의 숫자를 알지 못할 때 사용하면 유용합니다. 또한, 주어진 데이터에 이상치가 많이 포함되었을 때 사용하면 좋습니다.

밀도 기반 군집 분석(Density-Based Spatial Clustering of Applications with Noise, DBSCAN)은 일정 밀도 이상을 가진 데이터를 기준으로 군집을 형성하는 방법입니다.

▲ 그림 3-35 밀도 기반 군집 분석의 밀집도

노이즈(noise)에 영향을 받지 않으며, K-평균 군집화에 비해 연산량은 많지만 K-평균 군집화가 잘 처리하지 못하는 오목하거나 볼록한 부분을 처리하는 데 유용합니다.

▲ 그림 3-36 밀도 기반 군집 분석의 데이터 표현

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.