k-평균 클러스터링 알고리즘 코딩하기
파이썬으로 k-평균 알고리즘 코드를 작성해 봅시다.
1. 먼저 k-평균 알고리즘에 필요한 패키지를 불러옵니다. 여기서는 sklearn 패키지를 사용합니다.
[in :]
from sklearn import cluster
import pandas as pd
import numpy as np
2. k-평균 알고리즘에 사용할 간이 데이터를 만듭니다. 2차원 문제 공간에 있는 데이터 포인트 20개를 임의로 생성합니다.
[in :]
dataset = pd.DataFrame({
'x': [11, 21, 28, 17, 29, 33, 24, 45, 45, 52, 51, 52, 55, 53, 55, 61, 62, 70, 72, 10],
'y': [39, 36, 30, 52, 53, 46, 55, 59, 63, 70, 66, 63, 58, 23, 14, 8, 18, 7, 24, 10]
})
3. 클러스터 개수를 2로 설정(k = 2)하고 fit 함수를 사용해서 클러스터를 생성합니다.
[in :]
myKmeans = cluster.KMeans(n_clusters=2)
myKmeans.fit(dataset)