다음 그림은 k-평균 알고리즘을 2차원 문제 공간에 적용한 결과입니다.
▲ 그림 6-8 2차원 문제 공간에 적용한 k-평균 알고리즘
종료 조건
일반적인 k-평균 알고리즘의 종료 시점은 5단계에서 클러스터 중심점이 더 이상 변화하지 않을 때입니다. 다른 알고리즘과 마찬가지로 거대한 고차원 데이터를 처리하는 경우 k-평균 알고리즘도 수렴하는 데 시간이 꽤 오래 걸릴 수 있습니다. 이 경우에는 다음과 같은 종료 조건을 설정하는 것을 고려할 수 있습니다.
• 최대 실행 시간을 설정합니다.
– 종료 조건: t > tmax′는 현재 소요 시간을, tmax는 알고리즘 실행에 소요될 수 있는 최대 시간 허용치를 의미합니다.
• 최대 반복 횟수를 설정합니다.
– 종료 조건: m > mmax′는 현재 반복 횟수를, mmax는 알고리즘의 최대 반복 횟수를 의미합니다.