더북(TheBook)

명령줄 플래그를 몇 가지 설명하면 다음과 같다.

-N은 SimpleKMeans가 만들 클러스터의 개수를 정한다.

-A는 사용할 거리(distance) 함수다. 기본값은 유클리디언 거리이며, (-R first -last)에 따라 값의 전체 범위를 사용한다.

-l 플래그는 k-means가 클러스터를 만들기 위해 반복할 횟수다.

-S는 난수의 시드(seed)값이다. 여러분이 원하는 숫자를 사용할 수 있다.

Choose 버튼 옆에 있는 명령줄 옵션을 클릭하면 팝업창이 뜨며 여기서 값을 변경할 수 있다. numClusters 필드의 값을 2에서 4로 바꾼다(그림 8-8). 클러스터를 4개 만들겠다는 의미다. OK 버튼을 클릭하여 창을 닫는다.

▲ 그림 8-8 SimpleKMeans 옵션 변경하기

 

Start 버튼을 클릭하여 클러스터링을 시작한다. 처리하는 동안 탐색기(Explorer) 왼쪽 하단의 상태 표시줄을 지켜보는 것도 공부가 될 것이다.

클러스터링이 완료되면 Clusterer output 창에 작업 결과가 표시된다. 결과는 다음 절에서 살펴보자.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.