더북(TheBook)

출력 결과 클러스터에 대한 ID(cluster_idx_x)와 클러스터 중심 값(cluster_centers) 모두 텐서 형태를 보여 줍니다. 클러스터 개수를 3으로 지정했기 때문에 클러스터 ID는 0, 1, 2의 값을 가지며(클러스터를 4로 지정하면 클러스터 ID는 0, 1, 2, 3의 값을 가짐), 클러스터 중심 값은 유클리드 거리 계산 기법을 이용합니다.

이제 테스트 데이터셋을 이용하여 예측해 보겠습니다.

코드 11-11 K-평균 군집화 예측

cluster_ids_y = kmeans_predict(
    y, cluster_centers, 'euclidean', device=device
) ------ 예측을 위해서는 kmeans_predict( )를 사용

다음은 K-평균 군집화에 대한 예측 결과입니다.

predicting on cpu..

별다른 결과 없이 어떤 장치(GPU/CPU)를 사용하는지에 대해서만 출력합니다.

예측 결과를 그래프로 알아보기 전에 테스트 데이터셋에 대한 클러스터 ID 값을 먼저 살펴보겠습니다.

코드 11-12 테스트 데이터셋에 대한 클러스터 ID

print(cluster_ids_y)
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.