프로그래머가 알아야 할 알고리즘 40: 6.2.1 유사도 측정하기

k-평균 클러스터링 알고리즘 코딩하기

파이썬으로 k-평균 알고리즘 코드를 작성해 봅시다.

1. 먼저 k-평균 알고리즘에 필요한 패키지를 불러옵니다. 여기서는 sklearn 패키지를 사용합니다.

[in :]

from sklearn import cluster
import pandas as pd
import numpy as np

2. k-평균 알고리즘에 사용할 간이 데이터를 만듭니다. 2차원 문제 공간에 있는 데이터 포인트 20개를 임의로 생성합니다.

[in :]

dataset = pd.DataFrame({
  'x': [11, 21, 28, 17, 29, 33, 24, 45, 45, 52, 51, 52, 55, 53, 55, 61, 62, 70, 72, 10],
  'y': [39, 36, 30, 52, 53, 46, 55, 59, 63, 70, 66, 63, 58, 23, 14, 8, 18, 7, 24, 10]
})

3. 클러스터 개수를 2로 설정(k = 2)하고 fit 함수를 사용해서 클러스터를 생성합니다.

[in :]

myKmeans = cluster.KMeans(n_clusters=2)
myKmeans.fit(dataset)

신간 소식 구독하기

뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.