더북(TheBook)

워크벤치를 이용한 방법

워크벤치를 이용한 방법은 웨카의 사용자 인터페이스를 사용하여 데이터를 로드하고, 클러스터링하고, 시각화한다. 실제 프로그래밍이 필요하지는 않지만, 명령줄 작업이나 코드 예를 진행하기 전에 웨카가 무슨 일을 하는지 확인할 수 있어 유용하다.

 

데이터 로딩

워크벤치 작업 과정은 이전에 작업했을 때와 비슷하다. 먼저 CSV 데이터를 로드한다.

Open file 버튼을 클릭하고 kmeansdata.csv 파일을 선택한다(그림 8-5). 단, 파일 형식 드롭 다운 메뉴에서 ARFF가 아닌 CSV가 선택되어 있어야 한다. 아니면 파일을 열 수 없다.

데이터가 로드되면 탐색기에 여러 정보가 표시될 것이다. Current relation 창에서는 두 속성과 인스턴스 75개가 있음을 볼 수 있다(그림 8-6). 속성 정보(attribute information)는 두 속성, x와 y를 보여준다.

오른쪽 패널의 Selected attribute에는 로드한 데이터의 몇몇 통계, 최솟값, 최댓값, 평균, 표준편차가 표시된다. 마지막으로 값의 분포와 빈도 그래프가 있다.

▲ 그림 8-5 웨카에서 CSV 데이터 로드하기

 

▲ 그림 8-6 Preprocess 창

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.