더북(TheBook)

첫 번째 실행

.arff 파일에 SimpleKMeans를 실행하여 명령줄 방법을 테스트해보자. .arff 파일은 훈련용 파일이다.

java -cp /path/to/weka.jar weka.clusterers.SimpleKMeans -t kmeandata.arff

-t 플래그는 웨카가 클러스터링하려는 훈련용 파일을 지정한다. 실행하면 다음과 같은 결과가 나온다.


kMeans
======

Number of iterations : 3
Within cluster sum of squared errors : 5.839457872519278
Missing values globally replaced with mean /mode

Cluster centroids :
                        Cluster#
Attribute     Full Data         0         1
                   (75 )      (35 )      (40 )
============================================
x                 54.88   41.0571     66.975
y               92.0267   45.4286      132.8

=== Clustering stats for training data ===

Clustered Instances
0      35 ( 47 %)
1      40 ( 53 %)

 

작동은 제대로 된다. 클러스터가 두 개만 나왔지만, 더 나올 수 있다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.